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完全 信息 静态 博弈 


在 李 章 中 ,我 们 讨论 如 下 简单 形式 的 博弈 :开始 时 由 参与 者 同时 选择 行 
动 ,然后 根据 所 有 参与 者 的 选择 , 每 个 参与 者 得 到 各 自 的 结果 (一 定 的 收益 
或 支出 )。 在 此 类 静态 ( 即 各 方 同时 行动 ) 的 博弈 中 ,我 们 的 分 析 叉 仅 限 于 完 
全 信息 博 蛮 的 情况 , 即 每 一 参与 者 的 收益 酉 数 ( 根 据 所 有 参与 者 选择 行动 的 
不 同 组 合 决 定 革 一 和 参与 者 收益 的 函数 ) 在 所 有 参与 者 之 间 是 共同 知识 
(common knowledge)。 我 们 在 本 书 的 第 2 章 和 第 4 章 讨 论 动态 ( 即 序 贯 行 
动 ) 博 弈 ,在 本 书 的 第 3 章 和 第 4 章 分 析 不 完全 信息 博弈 (博弈 中 的 一 些 参 
与 者 不 知道 其 他 参与 者 的 收益 凿 数 ,如 拍 雪 中 每 一 人 都 不 清楚 其 他 人 到 底 
愿意 为 拍卖 品 出 多 高 的 价格 }。 

在 第 1.1 节 首 先 介 绍 博 弈 论 入 门 的 两 个 最 基本 问题 ;如何 描 述 一 个 全 
弈 问题 以 及 如 行 求 得 博弈 问题 的 解 。 我 们 定义 博弈 的 标准 式 表 述 和 严格 劣 
战略 的 概念 , 并 说 明 有 些 博弈 问题 只 要 运用 理性 参与 者 绝 不 会 使 用 严格 劣 
战略 这 一 原则 , 就 可 得 到 解决 ,但 此 康 则 在 其 他 博弈 问题 中 也 可 能 出 现 非常 
不 精确 的 预测 ( 像 任 何 结果 都 有 可 能 发 生 之 类 }。 接 车, 我 们 引出 纳什 均衡 
的 概念 并 给 出 定义 一 一 这 一 概念 的 用 途 很 广 , 对 很 多 类 型 的 博弈 都 能 作出 
Bs Pe 

在 第 1.2 节 我 们 运用 前 面 介绍 的 工具 , 分 析 其 四 个 应 用 模型 : 古 诺 
(Cournot, 1838) 的 不 完全 竞争 模型 , OF = M Bertrand, 1883}) 的 不 完全 竞 
争 模 型 , $ ih (Farber, 1980} 的 量 后 要 价 仲 堆 和 公共 财产 问题 ( 休 访 
(Hume), 1739 年 提出 了 此 类 问题 ,以 后 妇 不 断 被 经 济 学 家 提出 讨论 )。 在 
每 一 应 用 例子 中 , 我 们 先 把 问题 的 非 标准 描述 转化 为 博弈 的 标准 式 ,其 后 再 
FHIREAN. (Las -ATREEE HATH, BRNit 
论 的 范围 却 不 限于 此 。)} | 

在 第 1.3 节 重 回 理论 分 析 。 首 先 我 们 定义 混合 战略 {Mixed strategy), 
它 可 理解 为 一 个 参与 者 并 不 能 确定 其 他 参与 者 将 会 如 何 行动 , 然后 引出 并 
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讨论 纳什 定理 , ERRE T CEE a RRS PRES ATH R 
《也 许 会 是 混合 战略 均衡 )。 直 于 我 们 在 第 1.1 节 介 绍 了 最 基本 的 理论 ,在 
第 1.2 节 安排 了 应 用 举例 ,最 后 在 第 1.3 节 又 给 出 了 更 进一步 的 理论 内 容 ， 
显然 ,在 第 1.3 节 中 更 深入 的 理论 探讨 ,对 第 1.2 节 例 子 的 理解 并 不 是 必须 
的 前 提 , 混合 战略 的 概念 和 均衡 的 存在 性 在 以 后 各 章 中 都 时 有 提 及 。 

本 章 及 其 后 各 章 后 面 均 附 有 习题 、 建 议 以 及 进一步 的 阅读 资料 及 和 参考 
文献 目录 。 


1.1 基础 理论 :博弈 的 标准 式 和 纳什 均衡 


1.1.4 博弈 的 标准 式 表 述 


在 博弈 的 标准 式 表述 中 , 每 一 参与 者 同时 选择 一 个 战略 ,所 有 参与 者 选 
择 战 略 的 组 全 次 定 了 每 个 参与 者 的 收益 。 我 们 异 一 个 经 典 的 例子 说 明 请 弈 
的 标准 式 一 一 囚徒 困 境 。 两 个 犯 菲 嫌疑 人 被 捕 并 受到 指控 , 但 除非 至 少 一 
个 人 招 认 犯罪 ,警方 并 无 充足 证 据 将 其 搞 罪 判刑 。 警 方 把 他 们 关 人 和 人 不同 牢 
室 , 并 对 他 们 说 明 不 同行 动 带 来 的 后 果 。 如 果 两 人 都 不 坦白 ,将 均 被 判 次 轻 
BIG, 入 狱 一 个 月 ;如 果 双 方 都 坦白 招 认 ,都 将 被 类 入 狼 6 个 月 ;最 后 , 如 
果 一 人 描 认 而 另 一 人 拒 不 垣 自 , 押 认 的 一 方 将 马上 获释 .而 另 一 人 将 判 人 狱 
$ 个 月 一 一 所 犯罪 行 6 个 月 ,干扰 司法 加 判 3 个 月 。 

办 徒 面临 的 问题 可 用 十 图 所 示 的 双 变 量 矩 阵 表 来 描述 。( 正 如 同一 个 
矩阵 一 样 , 双 变 量 和 矩阵 可 由 任意 多 的 行 和 列 组 成 ,“ 双 谈 量 " 指 的 是 在 两 个 参 
与 者 的 博弈 中 ,每 一 单元 格 有 两 个 数字 一 一 分 别 表 示 两 个 参与 者 的 收益 ) 
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囚徒 的 困境 


在 此 博弈 中 , 每 一 囚徒 有 两 种 战略 可 供 选 择 :坦白 (或 挡 认 ). 不 坦白 (或 沉 
BR), 在 一 组 特定 的 战略 组 合 被 选 定 后 ,两 人 的 收益 由 上 图 双 变 量 矩 阵 中 相 
应 单元 的 数据 所 表示 。 习 避 上 ,横行 代表 的 参与 者 (此 例 中 为 囚徒 1) 的 收 
益 在 两 个 数字 中 放 前 面 , 列 代表 的 参与 者 { 此 例 为 网 徒 2) 的 收益 置 于 其 后 。 
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这 样 ,如 果 因 徒 1 RUCI, WEE 2 RIAU, 囚徒 1 的 收益 就 是 - 9( 代 表 
服 型 9 个 月 ), 因 徒 2 的 收益 为 0( 代 表 马 上 开 释 )。 

现在 我 们 回 到 一 般 情况 。 博 弈 的 标准 式 表 述 包 括 :(T) 博 弈 的 参与 者 ， 
(2) 每 一 参与 者 可 殿 选 择 的 战略 集 , (3) 针 对 所 有 参与 者 可 能 选择 的 战略 组 
合 ,每 一 个 参与 者 获得 的 收益 。 我 们 后 耐 将 经 党 讨论 到 n 个 参与 者 的 博 
弈 , 其 中 人 参与 者 从 1 到 n 排序 , 设 其 中 任 一 参与 者 的 序号 为 i, 令 S RRS 
与 者 可 以 选择 的 战略 集合 ( 称 为 i 的 战略 空间 ), 其 中 任意 一 个 特定 的 战 
EHA s 表示 (有 时 我 们 写成 9 CS. 表示 战略 * EERE S PBR). > 
lsn sw) 表 示 每 个 参与 者 选 定 一 个 战略 形成 的 战略 组 合 , u; 表示 第 i 个 
参与 者 的 收益 函数 , ui(s1,…, sa ) 即 为 参与 者 选择 战略 (51,…, so 时 第 ; 个 
参与 者 的 收益 。 将 上 述 内 容 综 合 起 来 , 我 们 得 到 : 


定义 ”在 一 个 n 人 博弈 的 标准 式 表 述 中 , 参与 者 的 战略 空间 为 81,…， 
Sa BC BBW ujon uw; 我 们 用 G = {Sp tes Sait s wn] 表示 此 博 
aE 


尽管 我 们 普 提 到 在 博弈 的 标准 式 中 ,参与 者 是 同时 选择 战略 的 , 但 这 并 
不 意味 着 各 方 的 行动 也 必须 是 同时 的 ;只 要 是 每 一 参与 者 在 选择 行动 时 不 
知道 其 他 参与 者 的 选择 就 足够 了 , 像 上 例 中 牢 里 分 开关 押 的 因 徒 可 以 在 任 
何 时 间作 出 他 们 的 选择 。 更 进一步 ,尽管 在 本 章 中 博弈 的 标准 式 只 用 来 表 
示 参 与 者 行动 时 不 清楚 他 人 选择 的 静态 博弈 ,但 在 第 2 章 中 我 们 就 会 看 到 
标准 式 也 可 用 来 表示 序 贯 行动 的 博弈 , 只 不 过 另 一 种 变通 的 方式 一 一 博弈 
的 扩展 式 表 述 更 为 常用 , 它 在 分 析 动 态 问 题 时 也 更 为 方便 。 


1.1.B 重复 别 除 严格 劣 战略 


上 和 节 已 讲 过 一 个 博弈 的 表述 方法 .下 面 开 始 介绍 如 何 卷 手 分 析 一 个 博 
FAB. RINE BST ASI AACR ARS, 只 需 用 到 理 
性 的 参与 者 不 会 选择 严格 劣 战 略 这 一 原则 。 

在 因 徒 的 困境 中 , 如果 一 个 嫌疑 犯 选择 了 招 认 , 那么 另 一 人 也 会 选择 招 
认 , 被 判刑 6 个 月 ,而 不 会 选择 沉默 从 而 坐 9 个 月 的 牢 ; 相 伺 地 , SOR 
疑犯 选择 沉默 , 男 一 人 还 是 会 选择 招 认 ,这样 会 马上 获释 , 而 不 会 选择 沉默 
在 牢 里 渡 过 一 个 月 。 这 样 ,对 第 TAH, ARMM RES E 
路 一 一 对 因 徒 了 可 以 选择 的 每 一 战略 , 囚徒 i 选择 沉 黑 的 收益 都 低 于 选择 
招 试 的 收益 。( 对 任何 双 变 量 矩 阵 , 上 例 中 的 收益 的 具体 数字 0, -1, - 6, 


ae RE 


-9 挽 成 任意 的 本.R.P、S, 只 要 满足 T>R>P>5, 上 述 结 论 依 然 成 
Wo) AA. 


定义 ”在 标准 式 的 博弈 C = |S, Saitun o ui P, S si Ms; Iik 
BSA i 的 两 个 可 行 战略 ( 即 s; 和 sf 是 3 中 的 元 素 )。 如 果 对 其 他 参与 者 
每 一 个 可 能 的 战略 组 合 , i 选择 si 的 收益 若 小 于 其 选择 5 的 收益 , 则 称 战略 s; 相 
对 于 战略 s? 是 严格 省 战略 ; 


al Spee Se 1 SE Seen Te sn) ts Sena See Sede oe Sn) o (DS) 


对 其 他 参与 者 在 其 战略 空间 Sy, ---, S:-_1, Si+1,…, Sa 中 每 一 组 可 能 的 战 
B sis iL? i+ +» s ) 都 成 立 。 

理性 的 参与 者 不 会 选择 严格 穷 战 略 ,因为 他 (对 其 他 人 选择 的 战略 ) 无 
法 作出 这 样 的 推断 , 使 这 一 战略 成 为 他 的 最 优 反 应 ,了 这 样 ,在 内 徒 的 困境 
中 ,一 个 理性 的 参与 人 会 选择 招 认 , TEGAN, 招 认 )? 就 成 为 两 个 理性 参与 
者 的 结果 ,尽管 ( 招 认 , 捆 认 ) 带 给 双方 的 福利 都 比 ( 沉 默 ,沉默 } 要 低 。 内 徒 
的 困境 的 例子 还 有 很 多 应 用 , 我 们 将 在 第 2 章 和 第 4 章 讨论 它 的 变型 。 现 
在 , 我 们 来 看 理 久 参 与 者 不 选择 严格 劣 战 略 这 一 原则 是 否 能 解决 其 他 博弈 
问题 。 


1.1.1 
考虑 图 1.1.1 所 示 抽 得 博弈 的 例子 ,@ 参与 人 1 有 两 个 可 选 战略 , S 


与 人 2 有 3 个 可 选 战 略 :;S1 = [上 ,下 5Sz=j 堪 , 中 , 右 i。 对 参与 人 1 来 
和 进 , 上 和 下 部 不 是 严格 占 优 的 :如 果 2 选择 左 , 上 优 于 于 (因为 1>0), 但 如 2 


D HEH MGR LRA. ORR BSA MAGS SHRM EERE 
BA TEES s 成 为 他 的 最 优 上 反应, 我 们 能 否 得 到 结论 ,一 定 存在 另 一 战略 是 s Bm h 
me? 管 案 是 肯定 的 。 前 据 蚌 对 “推断 "和 "“ 另 一 战略 "的 正确 理解 ,两 者 都 涉及 到 将 在 第 1.3.A 节 中 
St GY HE ARE 

钙 ” 本 书 的 笔 大 多 数 例 子 都 取 自 经 济 学 的 实际 应 用 , MRS RAR SRA. 这 不 仅 因 
为 庶 用 本身 往往 角 有 趣味 .还 因为 应 用 经 党 是 解禁 理 论 的 较 好 方式 。 不 过 在 说 明 一 些 基本 的 理 记 
原理 时 , 我 们 有 时 也 求助 于 没有 现实 怒 济 含义 的 抽象 例 子 。 
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选择 右 , 下 就 会 优 于 上 (因为 2>0)。 但 对 参与 人 2 来 讲 , 右 严格 劣 于 中 ( 因 
为 2>1 且 1>0), 因 此 理性 的 参与 人 2 是 不 会 选择 右 的 。 那 么 , 如 果 参 与 
Al 知道 参与 人 2 是 理性 的 , 他 就 可 以 把 右 从 参与 人 2 ARS Se) PRR, 
即 如 果 参 与 人 1 知道 参与 人 2 是 理性 的 , 他 就 可 以 把 图 1.1.1 ra ee 
同 为 图 1.1.2 所 示 博 弈 


#25A2 
paar E [e 


W 1.1.2 


在 图 1.1.2 中 ,对 参与 人 1 KA, FRET LYE eee, 于 是 如 果 
参与 人 1 是 理性 的 (并 且 参 与 人 1 知道 参与 人 2 是 理性 的 , 这样 才能 把 原 博 
弈 简化 为 图 1.1.2), 参 与 人 1 就 不 会 选择 下 。 那 么 , 如果 参 与 人 2 知道 参 
与 人 1 是 理性 的 ,并且 参与 人 2 知道 参与 人 1 知道 参与 人 2 是 理性 的 (从 而 
参与 人 2 知道 原 博弈 将 会 简化 为 图 1.1.2 所 示 博 弈 ), 参 与 人 2 就 可 以 把 下 
从 参与 人 1 的 战略 空间 中 剔除 ,余下 图 1.1.3 所 示 博 弈 。 但 这 时 对 参与 人 
2, 在 叉 成 为 中 的 严格 省 战略 , 仅 镜 的 (上 , 中 ) 就 是 此 博弈 的 结果 。 


£512 


在 中 
tear F [os [or] 
图 1.1.3 


上 面 的 过 程 可 称 为 "重复 删除 严格 劣 战略 "。 尽 管 此 过 程 建 立 在 理性 参 
与 人 不 会 选择 严格 劣 战略 这 一 合 情 近 理 的 原则 之 上 , 它 仍 有 两 个 缺陷 :第 
一 ,每 一 步 剔 除 都 需要 参与 者 间 相 互 了 解 的 更 进一步 假定 , 如 果 我 们 要 把 这 
一 过 程 咏 用 到 任意 多 步 ,就 需要 假定 “参与 者 是 理性 的 "是 共同 知识 。 这 意 
KS, 我们 不 仅 洛 要 和 假定 所 有 参与 人 人 蚌 理性 的 ,还 要 想 定 所 有 参与 人 都 知道 
所 有 参与 人 是 理性 的 ,还 需要 假定 所 有 参与 人 都 知道 所 有 参与 人 都 知道 所 
有 参与 人 是 理性 的 , 如 此 等 等 ,以 至 无 穷 ( 关 于 共同 知识 的 正式 定义 参见 奥 
(Aumann, 1976))。 

BS ARPS SRE PRE TIX EMR ROS 
党 是 不 精确 的 。 例 如 ,在 1.1.4 中 的 博弈 中 , RRA TL SRY ERS 
略 。( 由 于 溅 有 现实 事件 作为 基础 ,这 一 博弈 可 能 会 被 认为 是 随意 编制 或 不 


6 MARE 


APR, 为 此 我 们 还 可 以 参考 1.2.A 中 经 济 学 应 用 部 分 反映 同一 实质 的 
3 个 及 更 多 企业 的 古 诺 模型 既然 所 有 战略 都 经 得 住 对 严格 劣 战 略 的 重复 
NER, 该 方法 对 分 析 和 请 弈 将 出 现 什 么 结果 毫 无 帮助 。 


在 中 a 


FA 1.1.4 


下 面 我 们 介绍 纳什 均衡 , 它 是 一 种 博弈 的 解 的 概念 , 可 以 对 非常 广泛 类 
型 的 博弈 作出 严格 得 多 的 预测 。 我 们 通过 参与 者 的 纳什 均衡 战略 绝 不 会 在 
HES RPS eR et Pe BR, 而 重复 剔除 劣 战 略 后 所 留 战略 却 
不 一 定 满 是 纳什 均衡 成 略 的 条 件 , 来 证 明 纳 什 均 衡 是 一 个 比重 复 副 除 严 格 
FRE Re. URS RRL RAHA PS, 甚至 
纳什 均衡 对 博 赛 结果 的 预测 也 可 能 是 不 精确 的 , 从 而 还 需要 定义 条 件 更 为 
严格 的 均衡 概念 。 


1.1.C ihk S HAE 


导出 纳什 均衡 的 途径 之 一 ,是 证 明 如 果 博 弈 论 还 可 以 为 博 赛 问题 提供 
一 个 惟一 解 ,此 解 一 定 是 纳什 均衡 , 原因 如 下 。 设 想 在 博弈 论 预 测 的 博弈 结 
果 中 , 给 每 个 参与 者 选 定 各 自 的 战略 , 为 使 该 预测 是 正确 的 , 必须 使 参与 者 
自愿 选择 理论 给 他 推导 出 的 战略 。 这 样 ,每 一 参与 者 要 选择 的 战略 必须 是 
针对 其 他 参与 者 选择 战略 的 最 优 反应 ,这 种 理论 礁 测 结果 可 以 叫做 “战略 稳 
定 " 或 “让 动 实施 "的 ,因为 没有 参与 人 愿意 独自 离弃 他 所 选 定 的 战略 , 我 们 
把 这 一 状态 称 为 纳什 均衡 。 


定义 在 n 个 参与 者 标准 式 博 斌 GG = 1S1,…， Sabin > ta P, WẸ 


战 覆 组 全 [sr ,si 满足 对 每 一 参与 者 i’ 是 (至 少 不 秒 于 ) 他 针对 其 
他 n 一 1 个 参与 者 所 选 战略 |s，… ,ss 01,…,s* | 的 最 优 反应 战略 , 则 
称 战略 组 合 js?7 , …, s* 上} 是 该 博弈 的 一 个 纳什 均 征 。 即 : 


* + * a *) 
PAETI +s Sj lsi; sitio 154 


r * 
us ety SPs Sis Siete 3 SH) “ (NE) 


BIF ZPPRP SAH 7 
对 所 有 Si 中 的 s; 都 成 立 , 亦 即 s; ÆA T BALI y A: 


max; lst ss Si Sis Sger Sede 
5&5, 


ATE TH TE MAM IT Gi He BS HE SS HR ARR, 设想 有 一 标准 式 情 弈 G = 
[Sata Sys teas ts tal, ER E EE RBS st 如 果 
lsi. 7s, TÆ G 的 纳什 均衡 , 就 意味 着 存在 一 些 参与 人 i, s; 不 是 针对 
1 的 最 优 友 应 战略 , 即 在 S; 中 存在 : ,使 得 : 


+ F r + E + - A F A 
WiC SE Si EET St Wi SL Sp-ys Si 7+1s U’ s3) . 


那么 , 如 果 博 弈 论 提 供 的 战略 组 合 解 is1，…, s | 不 是 纳什 均衡 , 则 至 少 有 
一 个 参与 者 有 动因 偏离 理论 的 预测 ,使 得 博 奔 真实 进行 和 理论 预测 不 一 致 。 
和 纳什 均衡 推导 密切 相关 的 是 协议 的 理念 :对 给 定 的 博弈, 如 果 参 与 者 之 阅 
要 商定 一 个 协议 决定 博 蛮 如 何 进行 ,那么 一 个 有 效 的 协议 中 的 战略 组 合 必 
须 是 纳什 均衡 的 战略 组 合 , 否则 , 至 少 有 一 个 参与 人 会 不 遵守 该 协议 。 

为 更 准确 地 理解 这 一 概念 , 下 面 求解 几 个 例题 。 考 虑 前 面 已 措 述 过 的 
三 个 标准 式 博 弈 一 一 因 徒 的 困境 .图 1.1.1 和 图 1.1.4。 导 找 博 弈 纳什 均 
衡 的 一 个 最 直接 办 法 就 是 简单 查看 每 一 个 可 能 的 战略 组 合 是 否 符合 定义 中 
不 等 式 LNE) 的 条 件 .@ 在 两 人 博弈 中 , 这 一 方法 开始 的 程序 如 下 :对 每 一 
个 参与 者 ,并且 对 该 参与 者 每 一 个 可 选 战 略 ,确定 另 一 参与 者 相应 的 最 优 战 
We. B 1.1.5 中 ,就 把 图 1.1.4 RERET EER, 对 参与 者 i 的 每 一 
个 可 选 战略 , 在 参与 者 j 使 用 最 优 反应 战略 时 的 收益 下 面 划 了 横 线 。 例 如 ， 
如 果 列 参与 人 选择 左 , 行 参与 人 的 最 优 战 略 将 会 是 中 (因为 4 比 3 和 0 都 要 
大 ) ,于 是 我 们 在 双 变 量 矩阵 (中 , 左 ) 单 元 内 行 参 与 人 的 收益 “4" 下 划一 条 横 
线 。 


1.1.5 
如 果 在 一 对 战略 中 , FR EAR BB OO A, 


中 ”在 第 1.3.A 节 中 ,我 们 将 区 分 纯 战 略 和 混合 战略 , 那 时 我 们 就 会 看 到 此 处 所 给 的 纳什 均衡 
fe FA, ES eS, SE a, $ i E T r 
so Ti ES E. 


s Fe ae 


TNX NS BAERS WE AS ESR NEJK RF CORBY RR BE PEH R GS PSA e i 
值 下 面 都 被 划 了 横 线 )。 这 样 , (下 , EERE (NE) RAS, 
则 样 的 过 程 可 得 到 四 徒 困境 中 的 战略 组 合 ( 招 认 , 招 认 )、 图 1.1.1 中 的 战略 
组 合 (上 ,中 )。 这 些 战 略 组 合 就 是 各 自 博 弈 中 惟一 的 纳什 均衡 。 

下 面 我 们 重点 分 析 纳 什 均 隐 和 重复 别 除 严格 劣 战略 均衡 的 关系 。 我 们 
CHAN, DEERME 1.1.1 中 的 纳什 均衡 一 一 分 别 为 ( 招 认 , 招 认 ) 和 
(上 ,中 ) 一 一 正 是 经 过 重复 吻 除 严格 劣 战 略 后 仅 剩 的 战略 组 合 。 这 一 结果 
可 总 结 为 :如 果 用 重复 婚 除 严格 劣 战 略 把 除 战略 组 合 1s? ,…, s» | 外 所 有 的 
BW EL Ee ABSA BR PR, 则 该 所 存 战 略 组 合 就 是 此 博弈 惟一 的 纳什 均衡 (参见 在 
附录 1.1.C 中 这 一 结论 的 证 明 )。 不 过 ,由 于 重复 刚 除 严格 劣 战略 并 不 经 
常会 只 剩 下 惟一 的 战略 组 合 , EH EO a E R E R 
解 的 概念 ,自然 受到 更 多 关 注 , RAP. WRB si s* | 是 一 
个 纳什 均衡, 它 一 定 不 会 被 重复 蓟 除 严格 劣 战 略 所 崭 除 (同样 参见 附录 中 的 
证 明 ), 但 也 可 能 有 重复 吻 除 严格 劣 战 略 无 法 务 除 的 战略 组 合 , 其 本 身 却 和 
纳什 均衡 一 点 儿 关 系 都 没有 。 为 理解 这 一 点 ,请 想 一 下 图 1.1.4 RR, 
纳什 均衡 给 出 了 惟一 解 ( 下 , 右 ), 但 重复 剔除 严格 劣 战略 却 给 出 了 最 大 不 确 
定性 的 预测 :没有 任何 战略 组 合 被 删除 , 什么 结果 都 有 可 能 出 现 。 

证 明了 纳什 均衡 是 一 个 比重 复 刚 除 严 格 劣 战略 条 件 更 强 的 解 的 概念 之 
后 ,我 们 还 必须 解决 一 个 问题 , 就 是 纳什 均衡 作为 博弈 解 的 概念 ,条 件 是 否 
天 强 了 , 即 我 们 能 和 否 确 定 纳什 均衡 一 定 是 存在 的 ? 纳什 (1950) 证 明了 在 任 
何 有 限 博弈 ( 即 参与 者 n 和 战略 集 S1,…, S, 都 是 有 限 的 博弈 ) 中 , 都 存在 
至 少 一 个 纳什 均衡 (这 一 均衡 可 能 包含 了 混合 战略 , 我 们 将 在 1.3.A Pit 
论 ,并 参见 1.3.B 中 关于 纳什 定理 的 精确 表述 )。 古 诺 (1838) 在 双 头 垄断 
模型 这 一 特定 的 环境 中 提出 了 同样 的 均衡 福 念 , 并 通过 构造 的 方法 证 明了 
模型 中 均衡 的 存在 性 (参见 第 1.2.A 节 )。 在 本 书 的 每 一 个 应 用 分 析 中 ,我 
们 都 将 沿 获 十 诺 的 思路 :即将 通过 构造 一 个 纳什 均衡 (或 条 件 更 强 的 均衡 ) 
的 方法 ,证 明 均衡 本 身 的 存在 性 。 不 过 在 一 些 理论 章节 中 , 也 有 直接 依据 纳 
什 定理 (或 条 件 更 强 时 的 类 似 定 理 ), 简单 断定 均衡 存在 的 情况 。 

我 们 用 另 一 经 典 例子 作为 本 节 小 结 一 一 性 别 战 博弈 。 这 一 例子 表明 一 
个 博弈 可 以 有 多 个 纳什 均衡 , 并 且 在 第 1.3.B 和 第 3.2.A 节 讨 论 混合 战略 
时 也 用 得 到 。 关 于 这 一 博弈 的 传统 表述 (要 知道 这 一 博 弈 从 20 世纪 50 年 


中 ”这 一 结论 即使 在 不 限于 纯 战 略 的 条 件 下 也 亲 样 成 立 , 因为 在 这 些 战略 中 不 存在 混合 疏 略 
纳 御 均衡 。 参 见习 题 1.10。 
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AR TT ta), dA A Be EE TR PIE, 我 们 分 
AIX — SF PEMA AN CEL Me Re AE ET IK 
ANERE REER, WEP A Se BB eA A BB EE - T 
夜晚 , TGA RS} FP BEREA E — Po, aE 
起 欣赏 歌剧 ,如 下 面 双 变量 矩阵 所 示 : 


歌剧, 歌剧) 和 ( 爷 击 ,拳击 ) 都 是 纳什 均衡 。 

以 上 我 们 论证 了 如 果 博 弈 论 可 以 为 一 个 博弈 提供 惟一 解 , 此 解 一 定 是 
一 个 纳什 均衡 。 这 一 命 古 没有 提 及 博弈 论 不 能 提供 惟一 解 的 可 能 情况 。 同 
时 还 论证 了 如 果 参 与 者 之 间 能 就 如 何 进行 给 定 的 博弈 达成 一 个 协议 , 该 协 
议 也 一 定 是 一 个 纳什 均 奖 , 但 这 一 命题 同样 没有 考虑 不 能 达成 协议 的 可 能 
情况 。 在 一 些 有 多 个 纳什 均衡 的 博弈 中 , 有 一 个 均衡 比 其 他 均衡 明细 占 优 
(后 面 各 章 的 主要 理论 内 容 就 是 找 出 不 同类 型 博弈 的 这 种 占 优 均衡 ), 这 时 ， 
多 个 纳什 均衡 的 存在 本 身 也 不 会 引出 其 他 问题 。 不 过 , 在 上 面 讲 的 性 别 战 
博弈 中 , (歌剧 , PRB A ed, 淮 击 ) 又 难 分 优 劣 ,这 说 明博 弈 论 对 有 些 博弈 
并 不 能 提供 惟一 解 ,参与 者 间 也 不 能 就 该 博弈 的 进行 达成 协议 -中 在 这 样 
的 博弈 中 , 纳什 均衡 用 于 预测 博弈 将 如 何 进行 的 作用 就 大 大 减弱 了 。 


附录 1.1.C 


本 附录 是 关于 1.1.C 提 到 的 两 个 命题 的 证 明 , 跳 过 这 些 证 明 对 以 后 南 
容 的 理解 不 会 有 很 大 影响 。 不 过 , 对 于 不 太 请 熟 正规 定义 及 证 明 操 作 的 读 
者 ,和 掌握 这 些 证 明 程 序 也 是 一 种 有 益 的 训练 。 


命题 A 在 = 个 参与 者 的 标准 式 博 弈 G = 13 ,Soixt ual 中， 


DO £13. BEF, RRR R= TAT CRRA). TAP OR 
剧 , REDA EH, a, A ae Ee ee HE — E i 
R-H FAM, PRENSA, 因为 它 的 导出 违背 了 协议 的 原则 。 不 过 , 无 论 我 们 对 
性 别 战 情 穿 中 的 纳什 均 寄 如 柯 评判 , 上面 的 命 恶人 雪 是 成 立 的 : 即 存在 博客 论 无 潜 惟 一 解 , 并 无 法 达 
成 协议 的 搏 妊 。 


10 aR eae 


On Re AR Pa SS AR RR st PST aR, 那 
么 这 一 战略 组 合 为 该 博弈 惟一 的 纳什 均衡 。 


命题 B En 个 参与 者 的 标准 式 博 弈 G = |5, e, Spit a zn 中， 
MFR RS sy ,…:'s: 是 一 个 纳什 均衡 ,那么 它 不 会 被 重复 剔除 严格 劣 战略 
所 剔除 。 


由 于 命题 B 的 证 明 比 较 简 单 , 我 们 先 用 它 作 一 个 热身 。 论 证 使 用 反 证 
法 , 即 我 们 先 假 定 一 个 纳什 均衡 解 在 重复 别 除 严格 洛 战 略 的 过 程 中 被 日 除 
掉 了 , 然后 证 明 如 果 该 假定 威 立 , 就 会 有 自 相 了 矛盾 的 结果 出 更, 从 而 证 明 假 
me OS Dy Fe FRR HY 

设想 战略 1s? ,…, s, | 是 标准 式 博弈 G = 1S), ,Sial a tia t ÉJ — 
个 纳什 均衡 , 但 同时 假定 (也 许 在 副 除 掉 1 和 3 了,…, ;#1 之 外 的 一 些 战略 之 后 ) 
Eistee sg P, s; 首先 称 为 应 被 噜 除 的 严格 省 战略 ,那么 S, 中 一 定 存 
在 尚未 被 吻 除 的 战略 sf 严格 优 于 s7 。 代 入 公式 (DS) ,我 们 得 到 


Ses Sina S; Sine o Sa) E WES 10s Ss SE s Site t'r Sn) - 
(1.3.7) 
RTS — AP YS A R BR ET R E a Tn) PE A 
(sy, tts Saas eb ty SQ APM. AY s; 是 均衡 战略 中 第 一 个 被 删除 的 
战略 ,均衡 战略 中 其 他 参与 大 的 战略 尚未 被 剔除 ,于 是 作为 (1.1.1) 的 一 个 
EA, FARZ 


Ose atta Si- SEa Sirp Sn E CS a T Si- si 四 
- {1.1.2} 
但 是 (1t.1.2) 和 公式 (NE) 是 地 盾 的 :根据 (NE), sr 必须 是 针对 (7 ， 
的 最 优 反 应 ,那么 就 不 可 能 存在 一 个 战略 PT 
于 *;* 。 这 一 耶 盾 证 明了 原 命题 成 立 。 
证 明 过 命题 B, 我 们 事实 上 已 经 证 明了 命题 A 的 一 部 分 :所 有 需要 证 明 
a) FA Fe OE BS BBR PE RS BBR OBR sie, sa 1 之 外 的 所 有 战略 ,该 
BESTS we. RE OB, fE fd A oS ee E l PRA RR, 这 
已 证 明了 在 该 博弈 中 均衡 的 惟一 性 。 我 们 假设 G 是 有 限 博弈 。 
论证 同样 使 用 反 证 靶 。 假 定 通过 重复 删除 严格 劣 战略 吻 除 掉 除 1s7 ， 
,si 外 的 所 有 战略 ,但 该 战略 不 是 纳什 均衡 。 那 么 一 定 有 某 一 参与 者 ; 
在 他 的 战略 集 S 中 存在 s,, 使 公式 (NE) 不 成 立 , 但 又 必须 是 在 噜 除 过 程 
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某 一 阶段 的 严格 劣 战 略 。 上 述 两 点 的 正规 表述 为 :在 Si 中 存在 存在 s;, 使 


CST Shas Si Soa ae tte Sa ase tt, Shoe Seo Sp tas > Sn) , 
{1.1.3) 
并 县 在 参与 者 i 的 战略 集中 存在 si ,在 日 徐 程 序 中 的 某 一 阶段 


于 St 
(1.9.4) 
对 所 有 其 他 参与 者 在 该 阶段 剩余 战略 可 能 的 战略 组 合 (s1,…, se 
Sitt a Sn) MRAZ. 由 于 其 他 参与 者 的 战略 (5 1 SPb ts Se ji 
终 未 被 删除 ,于 是 下 式 作为 (1.1.4) 的 一 个 特例 成 立 


uC sr ata Siis Sis Siete Sn a Csy yes S71 S; 537+13 5q) = 

(1.1.5) 

如 果 s; =s; (Ep s? 是 s; 的 严格 占 优 战略 Y, Bh 1.1.5 和 1.1.3 相互 矛 

盾 , 这 时 证 明 结 束 。 如 果 s; Ash ,由 于 si 在 最 终 被 剔除 掉 了 , 则 一 定 有 其 

他 战略 * 在 其 后 严格 优 于 s; 。 这 样 , 在 不 等 式 (1.1.4) 和 (1.1.5) 中 ,分 别 

FAs; Msi RP s Ms; 后 仍然 成 立 。 再 一 次 ,如 果 sp = s? 则 证 明 结束 , 否 

则 ,还 可 构建 两 个 相似 的 不 等 式 。 由 于 s; ES 中 惟一 未 被 剔除 的 战略 ; E 
复 这 一 论证 过 程 ( 在 一 个 有 限 的 博弈 中 ) 最 终 一 定 能 完成 证 明 。 


1.2 应 用 举例 
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正如 前 节 已 可 到 的 , 古 诺 (1838) 早 在 一 个 多 世纪 之 前 就 已 提出 了 纳什 
所 定 尽 的 均衡 (但 只 是 在 特定 的 双 头 理 断 模型 中 )。 古 诺 的 研究 现在 已 理 所 
当然 地 成 为 博弈 论 的 经 典 文 献 之 一 ,同时 也 是 产业 组 织 理 论 的 重要 里 程 碑 。 
这 里 ,我 们 只 讨论 古 诺 模型 的 一 种 非常 简单 的 情况 ,并 在 以 后 每 章 中 都 会 涉 
及 到 这 一 模型 的 不 同 变型 。 本 节 我 们 将 通过 模型 说 明 ;(a) 如 何 把 对 一 个 问 
题 的 非 正式 拱 述 转化 为 一 个 博弈 的 标准 式 表 述 ;(b) 如 何 通 过 计算 解 出 博 蹇 
的 纳什 均衡 ;(c) 重 复 剔 除 严 格 劣 战略 的 步 又。 

S qop 分 别 表述 企业 1.2 生产 的 同 质 产 品 的 产量 , 市场 中 该 产品 的 
总 供给 Q= gtg S P(Q)=42-Q 表示 市 场 出 清 时 的 价格 (更 为 精确 一 - 
些 的 表述 为 :;:Q<a 时 , P(Q) =a ~Q: Qa 时 , P{Q)=0)。 设 企业 i E 


iz Rese ara 


Fq HEREC C) = cq 即 企业 不 存在 固定 成 本 , 且 生 产 每 单位 产品 的 
边际 成 本 为 常数 c, 这 里 我 们 假定 c< a。 根据 十 诺 的 很 定 ， 两 个 企业 同时 
进行 产量 决策 了 。 

FAR ot a ae aE PS ae, 我 们 首先 要 将 其 化 为 标准 式 的 博弈 。 
前 节 已 讲 过 , 博弈 的 标准 式 表 述 包含 下 列 要 素 :(1) 博 弈 的 参与 人 ,(2) 每 一 
参与 人 可 以 选择 的 战略 , (3) 针 对 每 一 个 可 能 出 现 的 参与 人 的 战略 组 合 ,每 
一 参与 人 的 收益 。 双 头 董 断 模型 中 当然 只 有 两 个 参与 人 , 即 模型 中 的 两 个 
歼 断 企业 。 在 古 诺 的 模型 里 ,每 一 企业 可 以 选择 的 战略 是 其 产品 产量 ,我 们 
假定 产品 是 连续 可 分 割 的 。 由 于 产 出 不 可 能 为 负 , 每 一 企业 的 战略 空间 就 
可 表示 为 S;=(0, co), 即 包含 所 有 非 负 实数 . 其 中 一 个 代表 性 战略 * 就 是 
企业 选择 的 产量 , q; 宇 0。 也 许 有 的 读者 提出 特别 大 的 产量 也 是 不 可 能 的 ， 
因而 不 应 包括 在 战 赂 空间 之 中 , 不 过 , 由 于 Qa 时 , P(Q)=0, 任 一 企业 
都 不 会 有 gq: > a 的 产 出 。 

要 全 面 表 述 这 一 博 穿 并 求 其 均衡 解 , 还 需 把 企业 i 的 收益 表示 为 它 自 
己 和 另 一 企业 所 选择 战略 的 函数 。 我 们 假定 企业 的 收益 就 是 其 利润 额 ,这 
样 在 一 般 的 两 个 参与 者 标准 式 博弈 中 , 参与 者 : 的 收益 xifsi,s) 就 可 写 
为 ;外 


ai(qi.g) =a: pla,+¢@)-cl=¢la -ig +g}-e] . 


上 节 我 们 讲 过 ,在 一 个 标准 式 的 两 人 博弈 中 , 一 对 战略 (sr , sz ) 如 是 纳 
什 均 稀 , 则 对 每 个 参与 者 i,:; 应 该 满足 


uC ses 5) Jeu, si sj) - {NE} 


ERI S, 中 每 一 个 可 选 战略 ;; 都 成 立 , 这 一 条 件 等 价 于 :对 每 个 参与 
者 ;，s* 必须 是 下 面 最 优化 问题 的 解 ， 


MAX wi i€si,sf)- 


O ak PREP EA Oe (1883), 我 们 将 在 第 1.2.B 节 进 行 讨论 :企业 
选择 产量 .但 一 个 企业 先 选 , HE a a (1934) eS EH 2.1.8 
节 分 绍 。 最 后 ,在 第 2.3. PREE PBS (Friedman, 1971) 的 模型 ,其 中 古 诺 模 型 中 两 
个 企业 的 相互 影响 多 次 重复 发 生 。 

多 ”请 广 刀 这 里 我 们 的 表示 有 一 个 小 的 变化 ,合用 os, 5 ) 而 非 u(r, sz 两 者 都 表示 参与 
者 i OBAMAS SL AS eR. RE n AED RS ERA 
这 两 种 者 示 方 法 。 
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在 古 诺 的 双 头 垄断 模型 中 , 上面 的 条 件 可 具体 表述 为 ;一 对 产 出 组 合 
《cry eg ) 若 为 纳什 均衡 , 对 每 一 个 企业 i, 9; 应 为 下 面 最 大 化 问题 的 解 ; 


- * = + 一 ,和 二 一 
omar magi a; ) ma la (q+ qr )— ce] 


设 q; <a-e(T 面 将 证 明 该 假设 成 立 ), 企业 ii 最 优化 问题 的 一 阶 条 
FARGER, 又 是 充分 条 件 ; 其 解 为 


q=Ha-q; -0) ， (1.2.2) 


那么 , UDRP RAS (el. 92 ) 要 成 为 纳什 均衡 ,企业 的 产量 选择 必须 
满足 : 


二 


1 ® 
qi =a (a-a ~ce) 


q2 = 二 (ae -全 一 c) . 
解 这 一 对 方程 组 得 


# 一 s a4 7 
Fi q2 3 


均衡 解 的 确 小 于 a - ,满足 上 面 的 假设 。 

对 这 一 均衡 的 直观 理解 非常 简单 。 每 一 家 企业 当然 都 希望 成 为 市 场 的 
垄断 者 , 这 时 它 会 选择 q 使 自己 的 利润 x,(g;,0) 最 大 化 , 结果 其 产量 将 为 
垄断 产量 gn = (a - <)/2 并 可 赚 取 垄断 利润 x;( gq;,0) = (a - c)2/4。 在 市 
场 上 有 两 家 企业 的 情况 下 ,要 使 两 企业 总 的 利润 最 大 化 , 两 企业 的 产量 之 和 
qi tq 应 等 于 垄断 产量 go 比如 qi= gm/2 时 就 可 满足 这 一 条 件 。 但 这 种 
安排 存在 一 个 问题 ,就 是 每 一 家 企业 都 有 动机 偏离 它 :因为 垄断 产量 较 低 ， 
相应 的 市 场 价格 pan ) 就 比较 高 , 在 这 一 价格 下 每 家 企业 都 会 倾向 于 提高 
产量 ,而 不 顾 这 种 产量 的 增加 会 降低 市 场 出 清 价 格 (为 更 清楚 地 理解 这 一 
点 ,参见 图 1.2.1, 并 检验 当 企业 1 的 产量 为 gw/2 时 ,企业 2 的 最 佳 产量 并 
不 是 ww/2)。 在 古 诺 的 均等 解 中 , 这 种 情况 就 不 会 发 生 . 两 企业 的 总 产量 要 
更 高 一 些 , 相应 地 使 价格 有 所 降低 。 习 题 1.4 是 关于 n POSE ey OF 
情况 , 菊 断 企业 一 方面 希望 提高 产量 , 但 又 不 原因 此 而 使 市 场 出 清 价格 下 
KE, 请 分 析 这 相互 矛盾 的 两 方面 是 如 何 取得 均衡 的 。 
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如 果 认 为 代数 方式 解 纳什 和 均衡 过 于 抽象 ,难以 理解 ,我 们 还 可 以 通过 图 
ERE, 方法 如 下 。 等 式 (1.2.1) 给 出 的 是 针 对 企业 j A PTE 
业 i 的 最 优 反 应 ,同样 的 方法 我 们 可 以 推导 出 针对 企业 1 的 任意 一 个 战略 
企业 2 的 最 优 反应 , 和 针对 企业 2 任意 一 个 战略 企业 1 的 最 优 反 应 。 假 定 
企业 1 的 战略 gi 满足 9t< ac 企业 2 的 最 优 反 应 为 


Rala) = Ala- q-e), 
类 似 地 ,如 果 qaca 一 c, 则 企业 1 的 最 优 反 应 为 
Ri(g2)= 方 (a gz—c) - 


4s 


(0,2 —c) 
R (gq) 


{O(a -£2) (好 各) 


(a — 0/2,0 
FA 1.2.1 


(a —¢,0) Ji 


如 图 1.2.1 所 示 , 这 两 个 最 优 反 应 函数 只 有 一 个 交点 ,其 交点 就 是 最 优 
产量 组 合 (gt ,gz )。 

求解 纳什 均衡 还 有 第 三 种 方法 , 即 运用 重复 剔除 严格 劣 战 略 。 在 本 例 
中 ,这 一 程序 只 得 到 惟一 解 一 一 根据 附录 1.1.C 中 的 命题 A, 一 定 为 纳什 均 
衡 解 (gi , 92 )。 完 整 的 过 程 需要 无 限 次 蓟 除 , 每 一 步 都 从 两 个 企业 剩余 的 
战略 空间 内 剔除 一 个 区 间 , 我 们 在 这 里 只 讨论 前 两 步 。 第 一 步 , 荀 断 产量 
Qm = Ca—c)/2 严格 优 于 其 他 任何 更 高 的 产量 , 邯 对 任意 r > 0, m; Cams a) 
> alan + 2,9, SERN 9,20 都 成 立 。 证 明 如 下 :如 果 Q=¢,+ 24+ 4; 
<a, PA 


a` cja Ze 


Ril gm: G) = 2 azs 9 | 
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nlan + esa) = [95% +2 |[2*5*-2-4;] 
=n; lan. qg) xix + qj} 
并 且 如 果 Q=¢, trt gza, M PC(Q)=0, 生 产 较 低 的 产 出 就 会 提高 利 
润 。 第 二 步 ,在 高 于 gn 的 产量 被 剔除 后 , 产量 Ca -*)74 严格 优 于 任何 更 
低 的 产量 , 即 对 任意 在 0 到 (a 一 c)/4 之 间 的 a,n [a 一 ce)/4, ql>xil(a 
—c)/4-2,9q; ERE 0 到 (a 一 c)/2 之 间 的 9 都 成 立 ,证 明 如 下 : 


ni (FZ, qp -47 | 


zj 


de cena] . 
eich ERE BUR, ERRER REE PURE T Ca- <)/4 
到 (a -ec)72 之 间 的 区 间 。 重 复 上 面 的 过 程 可 以 把 剩余 战略 空间 限制 得 越 
来 越 小 。 到 达 极 限时 , 这 一 区 间 就 成 为 一 个 点 a7 = (a 一 c)/3。 
重复 日 除 严 格 劣 战 略 的 方法 也 可 以 用 图 形 来 描述 ,这 要 用 到 我 们 前 面 
的 一 个 观察 结论 (附注 1, ASSL 1.3.A 中 的 讨论 ): 当 且 仅 当 对 其 他 参与 
者 的 战略 ,无 法 作出 这 样 的 推断 , 使 某 一 战略 成 为 最 优 反 应 战略 , 该 战略 为 
严格 步 战 略 。 由 于 本 模型 只 有 两 个 企业 , 我 们 可 以 特 这 一 结论 化 为 : 当 且 仅 
当 没 有 任何 gj; 可 使 gq, 成 为 企业 ; 的 最 优 反 应 战略 时 , si 为 严格 劣 战略 。 我 
们 仍 只 讨论 重复 剔除 过 程 的 前 两 步 。 第 一 ,对 企业 i 而 言 ,生产 超过 垄断 产 
Big, =(a-¢)/2 永远 不 会 是 最 优 反 应 。 我 们 以 企业 > 的 最 优 反 应 落 数 为 
例 来 证 明 这 一 点 :在 图 1.2.1 中 , 当 g =0 时, Raig ET gn, HPE gi 的 增 
加 而 递减 。 即 对 任意 的 gy; 宇 0, 如果 企业 i 相信 企业 j; 将 选择 qi cea i 的 
最 优 反 应 就 必然 小 于 或 等 于 gw ;不 存在 这 样 的 qj, 使 i 的 最 优 反 应 超过 g，,。 


nsa, -[- 
Ca q) 


> Rah, HEAR, 应 为 


zeas [e] a] 


=n 252.9, e[t] 一 译注 
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第 二 ,已 知 企业 j 产量 的 上 限 , 我 们 可 以 导出 企业 i 最 优 反 应 的 下 限 ; 邵 果 
gj 之 (a 一 c)/2, 则 有 R (g) Ela ~ c)/4, 如 图 1.2.2 所 示 企 业 2 的 最 优 反 


RED 


(fa-e¢)/2,0) (a-—c¢,0) 
A 1.2.2 


fi 


MLA, EEA MAEM EAA E g; = (a -ec)/3。 

为 总 结 李 节 内 容 ,我 们 把 证 诺 模 型 稍 作 变动 , E E Re Se R 
程序 不 能 得 到 惟一 解 。 要 做 到 这 一 点 ,只 需 在 上 面 的 双 头 董 断 模型 中 如 人 
一 个 或 更 多 的 企业 。 我 们 将 会 发 现 讨 论 双 头 董 断 时 的 前 两 步 中 , 第 一 步 依 
然 成 立 , 但 是 这 一 过 程 也 只 能 中 止 于 此 了 。 也 就 是 说 , Mee PT 
时 , 重复 田 除 严格 劣 战略 只 能 得 到 非常 不 精确 的 预测 , 即 每 个 企业 的 产 出 不 
会 超过 芍 断 条 忻 下 的 产量 。( 这 与 图 1.1.4 非常 类 似 , 在 那里 这 一 方法 木 能 
HOPE PE EAT ARES.) 

为 严谨 起 见 , 我 们 考虑 3 PS. OQ. ;表示 除 i 之 外 的 企业 
选择 的 产 出 之 和 ,并 令 nlg Q-go tn 
af 因为 如 果 g,4+ Q-a, M a; (g;,,Q-) = ~ cg), BHAT ¢g, = (a 
~oc)/2 严格 优 二 任何 更 高 的 产量 。 芭 对 任意 x >0, n; gas Q- >: (an 
二 工 ; Q- DHA 局 ;之 0 都 成 立 。 这 和 双 头 苑 断 条 件 下 的 第 一 步 完全 相 
同 。 不 过 ,由 于 除 i 之 外 还 有 两 个 企业 ,而 g 和 gq WERC- e)z 
B, 我 们 对 Q- ;所 能 作 的 惟一 界定 就 是 在 0 和 a 一 c 之 间 。 这 也 意味 着 对 
企业 i 而 言 ,任何 qi 人 0 都 不 是 严格 洗 战 略 , 因为 对 在 0 到 (a 一 cc)/2 闻 的 
EE go 都 存在 相应 的 在 0 到 a 一 c HH Q_,(AAMH, Q@-_;=a~c- 


T 这 两 步 证 朋 都 育 一 点 儿 不 完整 ,因为 我 们 没有 考虑 当 企 业 i RTE, 时 的 最 优 反 应 。 设 
bak :不 清楚 gq, 但 和 相信 Gg REA EC) AA alg gR F q 是 线性 的 ,这 种 条 件 下 企业 
i 不 确定 4 时 的 最 优 后 应 简单 等 于 它 确定 企业 i 将 选择 己 4 人 入 ) 时 的 最 优 反应 一 一 书 中 已 有 这 样 的 
例子 。 
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2q) E qg 成 为 企业 i 针对 QQ- AIR R M AEH eR 
Re > AE — AE BE o 
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(1883) 提 出 企业 在 竞争 时 选择 的 是 产品 价格 , 而 不 像 古 诺 模型 中 选择 产量 。 
首先 应 该 明确 员 特 兰 德 模 型 和 古 诺 模型 是 两 个 不 同 的 博弈 ,这 一 点 十 分 重 
要 :参与 者 的 战略 空间 不 同 , 收 益 函 数 不 同 ,并 且 ( 随 后 就 可 消 楚 地 看 到 ) 在 
两 个 模型 的 纳什 均 衔 中 , 企业 行为 也 不 同 。 一 些 学 者 分 别 用 十 谱 均衡 和 由 
特 兰 德 均衡 来 概括 所 有 这 些 不 同 点 ,但 这 种 担 法 有 时 可 能 会 导致 误解 : 它 只 
表示 古 诺 和 贝 特 兰 乱 博 弈 的 差别 , 以 及 两 个 博弈 中 均衡 行为 的 差别 ,而 不 是 
博 旗 中 使 用 的 均衡 概念 不 同 。 在 两 个 博弈 中 , 所 用 的 都 是 凸 节 我 们 定义 的 
纳什 均衡 。 

我 们 考 虐 两 种 有 差异 的 产品 (产品 完全 相同 的 情况 参见 习题 1.7)。 如 
果 企 业 1 和 企业 2 分 别 选 择 价 格 pl 和 py 消费 者 对 企业 i 的 产品 的 需求 
Al: 


Gil pis Pj) =a prt bp; ， 


其 中 6 >o, RRS Bo : Or A Pe RT ie 
求 函 数 在 现实 中 并 不 存在 ,因为 只 村 企业 了 的 产品 价格 足够 高 ,无论 企 业 i 
要 多 高 的 价格 ,对 其 产品 的 需求 都 是 正 的 。 后 面 将 会 讲 到 , 只 有 在 5<2 时 
问题 才 有 意义 )。 和 前 面 讨论 过 的 古 诺 模型 相似 , 我 们 假定 企业 生产 没有 固 
定 成 本 ,并且 边际 成 本 为 常数 c,c<a, 两 个 企业 是 同时 行动 (选择 各 自 的 价 
格 ) 的 。 

和 上 节 相 同 , 要 寻找 纳什 均衡 首先 需 槛 把 对 问题 的 航 述 化 为 博弈 的 标 
准 式 。 参 与 者 仍 为 两 个 , 不 过 这 里 每 个 企业 可 以 选择 的 战略 是 不 同 的 价格 ， 
而 不 再 是 其 产品 产量 。 我 们 假定 小 于 0 的 价格 是 没有 意义 的 ,但 企业 可 选 
择 任 意 非 负 价 格 一 一 比方 说 用 便士 标价 的 商品 , 并 无 最 高 的 价格 限制 。 这 
样 ,每 个 企业 的 战略 空间 又 可 以 表示 为 所 有 非 负 实数 S; = [0, 00), 其 中 企 
de i 的 一 个 典型 战略 * 是 所 选择 的 价格 pp; 二 0。 

我 们 仍 假 定 每 个 企业 的 收益 函数 等 于 其 利润 额 , 当 企业 i 选择 价格 p;， 
其 竞争 对 手 选择 价格 p 时 ,企业 i 的 利润 为 : 


if pis py) = gpis pp: ella pt bp, ll p;-¢] - 
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A, HERE Ce. pr ) 若 是 纳什 均 瞻 ,对 每 个 企业 i, p 应 是 以 下 最 优 
化 问题 的 解 : 

oi Pe pr y= max fa ~ pit bp; llac]. 


对 企业 i 求 此 最 优化 问题 的 解 为 


# 


pr =Flat bp} te). 

由 上 可 知 , 如 果 价 格 组 合 (ar ,pz ) 为 纳什 均衡 ,企业 选择 的 价格 应 满足 
Pr 一 Fla + bp? + evil pz = Lea +bpi te). 

解 这 一 对 方程 式 得 : 


Pi = p2 Ip + 


1.2.C REBAR 


许多 公共 部 门 的 职工 是 不 允许 轩 工 的 ,这 时 ,有关 工资 的 分 歧 通 过 具有 
约束 力 的 仲裁 解决 。( 棒 球 联合 会 在 主要 的 机 制 上 更 满足 这 一 条 件 ,但 在 经 
济 上 的 重要 福 就 差 多 了 ) 很 多 其 他 争议 ,包括 医疗 事故 .股票 持 有 人 对 其 股 
票 经 纪 人 的 投诉 等 ,也 多 通过 仲裁 解决 。 较 为 重要 的 仲裁 形式 有 两 类 ;协议 
仲裁 和 最 后 要 价 仲 裁 。 在 最 后 要 价 仲 裁 中 ,争议 双方 各 自 就 工资 水 平 要 价 ， 
促 藏 人 选择 其 中 之 一 作为 仲 栽 结果 ;在 协议 仲裁 中 , 与 之 不 同 的 是 ,仲裁 人 
可 自由 选 定 任意 工资 水 平 作为 仲裁 结果 。 本 节 我 们 根据 法 伯 (1982) 的 研 
究 , 导 出 在 最 后 要 价 仲裁 模型 处 于 纳什 均衡 时 , 博弈 双方 对 工资 水 平 的 要 
MaD 

假定 参与 争议 的 双方 一 为 企业 ,一 为 工会 ,争议 由 工资 而 起 。 博 弈 进行 
的 时 序 如 下 。 第 一 步 , 企业 和 工会 同时 开 出 自己 希望 的 工资 水 平 , 分 别 用 
wy 和 w., 表示 。 第 二 步 ,仲裁 人 在 二 者 之 中 选择 其 一 作为 结果 。( 与 许多 
被 称 为 静态 的 博弈 相似 , 它 其 实 属于 将 在 第 2 章 讨论 的 动态 博弈 ,只 不 过 这 
里 我 们 通过 对 仲裁 者 第 二 步行 为 的 假定 ,将 其 简化 为 企业 和 工会 之 间 的 静 
态 博 突 ) 假 定 仲裁 人 本 身 对 工资 水 平 有 自己 认为 合理 的 方案 , M r 来 表示 
这 一 理想 值 , 进一步 假定 在 观测 到 双方 要 价 wy Mw, 后 ,仲裁 人 只 是 简单 


中 ”这 一 和 庶 用 中 将 刁 及 一 些 基 本 的 概率 论 概 念 :累计 概率 分 布 .概率 密度 函数 各 期望值。 需要 
时 我 们 会 痕 出 简单 的 定义 和 解 琶 ;详细 资料 请 查阅 任何 一 种 介绍 择 率 论 的 教材 。 
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(w, +m /2 


图 1.2.3 


ARE x 最 为 接近 的 要 价 : 设 车 wr< zu,! 这 与 我 们 的 直觉 一 致 ,后面 将 会 
证 明 它 是 成 立 的 ), 如 果 x< (ww, + ww.)/2, 仲 裁 者 将 选择 wy; 如 果 z> (tw 
+ mw)72, 则 选择 w, 参见 图 1.2.3. (BF c= Cw, + w,)/2 的 情况 出 现 
时 ,选择 哪 一 个 都 无 关 紧 要 ,不 护 设 仲裁 者 搓 硬 币 决 定 ) 仲 裁 者 知道 x (AS 
与 双方 都 不 知道 , 他 们 相信 x 是 一 个 随机 变量 , 其 累积 分 布 函 数 为 Fx)， 
相应 的 概率 密度 消 数 为 A(x}? 了。 根据 我 们 对 仲裁 者 行为 的 假定 , 如果 双方 
A EOS BU wy Mwa, 那么 双方 推断 wy 被 选中 的 概率 Prob! w, 被 选 | 和 
ws 被 选中 的 概率 Probi w, BEI | oP SH 


Prob | wy, 被 选 1 = Probi < WSs = F(t wx) 


Probl w, 被 选 1 =1- FCM) | 
据 此 , 期 望 的 工资 水 平 为 
wey? Prob} wy 被 选 | + w Prob} w, WIE) 
= wp POS) + wef Fy | . 


我 们 假定 企业 的 和 目标 是 使 期 望 工资 最 小 化 的 仲裁 结果 , 工会 则 设法 使 
HEAL. BRA R wl. wl ) 是 这 一 企业 和 工会 间 博 弈 的 纳什 均 


D Bla APERE: RR PCa}, 并 及 对 x 7 ,导出 上 面 分 布 的 概率 窗 卉 为 了 
(r) 由 于 Fir ") 是 一 个 概率 ,所 以 对 枉 意 xz SBA OS Ce El ER, RR ar >r, WF 
{rr Fe), FAME z", fixy, 
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Gow, 必须 满足 :中 
十 * * 
min wy FOP) + ws [1 PES | 
=y 
H wi 必须 满足 : 
= wf + wy we + Ww, 
maxwy * F( > twi- FC z jJ- 


AAT, RAM LAY SABA Cwr, wl EMME E m ae tète m a Ag- Bi 
条 件 , A: 


wf twa yar wt Lwi) 


(wi -wjr 


Cw? -wi )- dp Mees yoy pie], 


Oa i Fei ait 2 6b i — Br a ES EE RAT RSS A 
完全 相同 ,其 右边 也 应 该 相等 ,这 意味 着 


wf +w: 
Ft 5 => , (4.2.2) 


即 , 双方 要 价 的 平均 值 一 定 等 于 仲裁 者 偏好 方案 的 中 值 。 把 (1.2.2) 代 入 任 
何 两 个 一 阶 条 件 之 一 可 得 


WO (1.2.3) 


它 表 示 双 方 要 价 之 差 等 于 仲裁 者 偏好 方案 中 值 点 概率 密度 的 倒数 。 

为 更 好 地 从 直观 上 理解 这 一 比较 静态 结果 , 下 面 我 们 考虑 一 个 具体 例 
子 。 设 仲裁 者 的 偏好 方案 遵从 期 望 值 为 m, 方差 o? 的 正 态 分 布 ,密度 函数 
为 


f(2)= ip -a~ m)?| + 


{在 此 例 中 , 我们 还 可 以 证 明 前 面 给 出 的 一 阶 条 件 同 时 也 是 充分 条 人 忻 。) 因 为 
正 态 分 布 在 其 期 望 值 两 侧 的 分 布 是 对 称 的 , AR PS TE mo 
这 了 时 {1.2.2) 就 成 为 


D 下 面 在 建立 和 求解 企业 与 工会 的 最 优化 条 忻 时 , 我 们 人 稻 定 企业 的 出 价 总 振子 工人 的 要 价 。 
其 后 , 我 们 将 会 证 明 这 一 假定 的 正确 性 。 


Bie AXSPRP OS 2i 


和 


| xa? 
Wy — 2 - 


这 里 , FHEAE tL Ah Be ae BS CB) A CRER, H 
要 价 之 差 随 双方 对 仲裁 者 偏好 方案 不 确定 性 ( 即 OOHRS KX, 
对 这 一 均衡 结果 的 直观 理解 也 很 简单 ,博弈 的 每 一 方 都 需 进 行 权衡 , 一 
个 更 为 激进 的 要 价 ( 妈 工会 更 高 的 要 价 或 企业 更 低 的 出 价 ) 一 旦 被 仲裁 者 选 
中 就 会 给 自己 带 来 更 高 的 收益 ,但 其 被 选中 的 可 能 性 却 会 相应 降低 (在 第 3 
BAL 节 蜡 封 出 价 拍卖 中 我 们 还 会 看 到 相似 的 得 失 权 衡 : 较 低 的 价格 如 果 
中 标 就 会 获得 更 好 的 收益 ,但 却 会 减少 中 标的 机 会 )。 当 对 仲裁 者 偏好 方案 
的 不 确定 程度 增加 { 即 a? 变 大 ?时 ,双方 的 要 价 之 所 以 能 更 为 激进 , 是 因为 
一 个 更 激进 的 价格 与 仲裁 者 偏好 方案 有 较 大 差别 的 可 能 性 变 小 了 。 相 反 ， 
如 果 几 乎 不 存在 任何 不 确定 性 , 双方 都 不 敢 开 出 一 个 离 期 望 值 很 远 的 要 价 
来 ,因为 仲裁 者 选择 离 m 最 近 的 方案 的 可 能 性 非常 大 。 


1.2.D 公共 财 问 题 


至 迟 从 休 谍 (1739) 开 始 , 政治 哲学 和 经 济 学 家 已 经 认识 到 和 如果 公民 只 
关注 个 人 福利 , 公共 物品 就 会 出 现 短缺 ,并且 公共 资源 也 会 过 度 使 用 。 今 
天 ,只 要 随便 看 一 下 地 球 的 环境 , 就 能 体会 到 这 一 观念 的 力量 。 喻 丁 
(Hardin, 1968) 被 广 为 引 用 的 论文 使 这 一 问题 引起 了 非 经 济 学 者 的 关注 。 
在 此 ,我 们 分 析 牧 场 的 例子 。 

考虑 一 个 有 n 个 村 民 的 村 庄 , 每 年 夏天 ,所 有 村 民 都 在 村 庄 公 共 的 
草地 上 放牧 。 用 上 表示 村 民 i 放养 羊 的 头 数 , 则 村 庄 里 羊 的 总 头 数 G 
= g1+ “二 gr。 购买 和 照看 一 只 羊 的 成 本 为 c, c 不 随 一 户 村 民 拥 有 羊 
的 数目 多 少 而 变化 。 当 草地 上 羊 的 总 头 数 为 G 时 ,一 个 村 民 养 一 只 羊 
的 价值 为 vtG)}。 由 于 一 只 羊 要 生存 , 至 少 需 要 一 定数 量 的 青草 , 草地 可 以 
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KHENA A OG: 4 G< GH, oG >0;48 GE G mnd, 
v(G)=0. ÆA, 由 于 最 初 的 一 些 羊 有 充足 的 室 间 放 四 ,再 如 一 只 不 会 对 
己 经 放养 的 羊 产生 太太 影响 ,但 当 草 地 上 旅 养 羊 的 总 数 已 多 到 怡 好 只 能 维 
生 的 时 候 ( 即 G tae Gutt), 再 增加 一 只 就 会 对 其 他 已 经 放养 的 羊 带 
RAMS. AAR BRAM, G Gun v(G)<0,8 0°(G)<0, MH 
1.2.4 所 示 。 


Gmax G 


E 1.2.4 


ERF, AY Ge [a] EE ep ae SREB Se, ABE EE SE OY 5S, 
ATER = 的 一 个 战略 就 是 他 选择 的 在 村 庄 草 地 上 放养 羊 的 数量 , co ME 
略 空 间 为 [0, 2), 它 包含 了 可 以 给 村 民 带 来 收益 的 所 有 可 能 选择 ; [0, Gm) 
其 实 也 是 够 了。 当 其 他 村 民 养 羊 数量 为 (g1,…, g-o Ein o nd, AR 
i 放养 g; 只 羊 获得 的 收益 为 


Ei" UE te t+ Bi gt Birt t+ gr) Teg- C1.2.4) 


RO, Sgt. gx ) 为 纳什 均衡 , 则 对 每 个 村 民 i, 当 其 他 村 民选 择 (gy ， 
时 ， Bi 必须 使 (1.2.4) 最 大 化 。 这 一 最 优化 问题 的 
— BREA 


vlg t+ g7,)tew (e:t+ gi )-c=0. (1.2.5) 


ix g :代表 gr +e + gy + ogfagt wes + gg ,将 g’ iA (1.2.5), 并 把 
所 有 村 民 的 一 阶 条 件 如 总 ,然后 再 除 以 = 得 


v6") +26" vG") -c=0 ， (1.2.6) 


HP, G* aR gr +e + gio 但 是 ,全 社会 的 最 优选 择 , 用 G™ 表示 ， Wi 
足 


max G-v(G)-Gre . 


DEG qa 
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它 的 一 阶 条 件 为 
vG” 1+G"v(G™)-c=0. (1.2.7) | 

将 (1.2.6) 与 (1.2.7) 相 比较 订 知 ,9 G “> G”: 和 社会 最 优 的 条 件 相 

比 , 纳什 均衡 时 放养 羊 的 总 数 太 多 了 。(1.2.5) 所 示 的 一 阶 条 件 表示 一 个 已 
经 放养 g; 只 羊 的 村 民 再 多 养 一 只 羊 的 收益 (或 更 严格 一 点 讲 ,是 再 多 养 “一 - 
点 几 "” 羊 的 收益 )。 这 多 出 的 一 只 羊 的 价值 为 ole + gt), EEEH co Xt 
该 村 民 已 经 养 的 羊 的 损害 为 每 只 羊 v (gi tgi RRA ew’ (gi + 
zi)。 公 共 资 源 被 过 度 使 用 了 , 因为 每 个 村 民 只 考虑 他 们 自己 的 利益 , 并 


不 管 其 行为 对 其 他 村 民 带 来 的 后 果 , 这 就 出 现 了 (1.2.6) 中 的 十 G” v 
CG"), MAECI.2.7) PÉ] G” o (Gn Jo 


1.3 理论 发 展 :混合 战略 和 均衡 的 存在 性 


1.3.4 混合 战略 


在 1.1.C 中 我 们 把 S 定义 为 参与 者 i 可 以 选择 的 战略 集 , 并且 对 每 一 
个 参与 者 is 为 其 针对 另外 ;一 1 个 参与 者 所 选 战略 的 最 优 反 应 , 则 战略 
HEren s Ae AAT, BE 


WiC si ss SS Zu lsi ss Sine Sis Sits s Sa) 
(NE) 
对 s; 中 每 一 s; 都 成 立 。 根 据 这 一 定义 ,下 图 所 示 “ 猿 硬币 "的 博弈 是 不 
存在 纳什 均衡 的 。 


SP MERE GLC", RAF v <0, ofG SoG"), BAF ve’ <0, A o> 
vG vr ( 6G"), BB, Gi /A 人 "从 而 ,1.2.6) 的 左边 特 严 格 大 于 {1.2.7) 式 的 左边 , 但 这 
是 不 可 能 的 ,因为 两 式 的 右边 都 等 于 0。 
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EERI t, 4—2 i A E D a OE A, PA). WR 
阵 表 中 所 列 参 与 者 各 自 的 收益 .设想 每 一 参与 人 拿 有 一 校 硬 币 , 并 必须 
选择 是 出 正面 向 上 还 是 背面 向 上 。 若 两 校 硬币 是 一 致 的 ( 即 全 部 正面 向 
上 或 全 部 背面 向 上 ), 则 参与 人 2 AESA 1 的 硬币 ;如 果 两 校 硬 币 不 
一 致 (一 正 一 反 ),. 参 与 人 1 赢得 参与 人 2 的 硬币 。 在 此 博弈 中 , 没有 一 
组 战略 能 够 满足 (NE}) 的 条 件 ,因为 如 果 参 与 者 的 战略 是 一 致 的 一 一 { 正 
面 , 正面) 或 {背面 , 背面 ) 一 一 那么 参与 人 1 就 希望 能 改变 战略 , URS 
与 者 的 战 赂 不 一 致 一 一 (正面 ,背面 ?或 (背面 ,正面 ) 一 一 则 参与 人 2 将 
希望 能 改变 战略 。 

猜 硬币 博弈 一 个 非常 突出 的 特点 是 每 个 参与 者 都 试图 能 先 猜 中 对 方 的 
战略 。 这 一 类 博弈 在 扑克 .棒球 .战争 等 其 他 环境 中 也 经 常会 发 生 。 在 时 扑 
克 牌 赌博 的 博弈 中 ,类 似 的 问题 是 如 和 何 典 定 使 许 的 次 数 :如 果 大 家 都 知道 参 
与 者 大 是 从 来 不 使 诈 的 ,那么 任何 时 候 当 下 很 高 的 赌注 时 他 的 对 手 就 会 
认输 ,但 这 又 使 得 i 偶然 使 诈 会 有 利 可 图 ;: 另 一 方面 ,使 诈 次 数 过 多 亦 非 上 
策 。 在 棒球 比赛 中 , REEF RCP RR, X ofpe H RER, 那么 击 
球 手 能 够 击 中 任何 一 类 投球 的 前 提 是 , 他 能 正确 估计 到 投球 手 将 掷 出 哪 一 
HER, SAA, 在 战争 中 , 假设 进攻 方 可 能 在 西 个 攻击 点 (或 两 条 进攻 路 
线 , 比如 * 陆 路 或 水 路 ") 中 选择 其 一 , 防御 方 可 以 抵御 来 自任 一 方向 的 攻击 ， 
但 也 只 在 它 正 确 预测 到 进攻 路 线 的 前 提 下 。 

在 博弈 中 ,一 旦 每 个 参与 者 都 竟 力 猜测 其 他 参与 者 的 战略 选择 ,就 不 存 
在 纳什 均 生 (至 少 不 存 在 第 1.1.C 节 所 定义 的 纳什 均衡 ), 因为 这 时 参与 者 
的 最 优 行为 是 不 确定 的 ,而 博弈 的 结果 必然 要 包含 这 种 不 确定 性 。 现 在 引 
入 混合 战略 的 概念 ,我 们 可 以 将 其 解释 为 一 个 参与 者 对 其 他 参与 者 行为 的 
不 确定 性 。( 这 一 解释 被 吉尔 绍 尼 (Harsanyi，1973) 深 化 ,在 第 3.2.A 节 中 
我 们 将 进一步 讨论 到 ?在 下 一 莫 我 们 将 把 纳什 均衡 的 定义 扩展 到 包含 混合 
战略 , 从 而 可 以 分 析 诸 如 猜 硬 币 .扑克 、 棱 球 及 战争 等 博弈 的 解 出 现 的 不 确 
定性 。 

规范 地 表述 ,参与 者 宇 的 一 个 混合 战略 是 在 其 战略 空间 S; 中 (一 些 或 
全 部 ) 战 上 略 的 概率 分 布 ,此 后 我 们 称 S; 中 的 或 略为 的 纯 战 略 (pure strate- 
gies)。 对 本 章 所 分 析 的 完全 信息 同时 行动 博弈 来 说 , 一 个 参与 者 的 纯 战 略 
就 是 他 可 以 选择 的 不 同行 动 , 例如 在 犹 磺 币 博弈 中 , S; 内 含有 两 个 纯 战 略 ， 
分 别 为 正面 和 背面 ,这 时 参与 者 i 的 一 个 混合 战略 为 概率 分 布 (g,1 一)， 
其 中 了 为 出 正面 向 上 的 概率 ,1- 9 为 出 背面 向 上 的 概率 , H 0 三 go 夺 1。 混 
合 战 略 (0,1) 表 示 和 参与 者 的 一 个 纯 战 略 , 即 只 出 背面 向 上 , 类似 地 , 汤 合 战略 
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《1,0) 表 示 只 出 正面 向 上 的 纯 战 略 。 

作为 混合 战 酷 的 第 二 个 例子 , 请 回顾 图 1.1.1 所 示 博 弈 ,参与 者 2 有 三 
A SEER BS :去 .中 、 右 ,这 时 他 的 一 个 混合 战略 为 概率 分 布 (9，r， 1 一 gq 一 
r), 其 中 ¢ 表示 出 左 的 概率 , > 表示 出 中 的 概率 , 1 一 g 一 + 表示 出 右 的 概 
率 , 和 前 面相 辣 , 0 三 gq 三 1, 且 这 里 还 应 满足 0 三 r 三 1 ROS trl. 在 此 
HAt, 混合 战略 (1/3, 1/3, 173) 表 示 参 与 者 出 左 、. 中 、 右 的 概率 相同 , 而 
《172,172,0) 表 示 出 左 .中 的 概率 相同 ,但 绝 不 可 能 选择 出 右 。 和 在 所 有 人情 
况 下 一 样 , 参与 者 的 一 个 纯 战 略 只 是 混合 战略 的 一 种 特例 , 例如 参与 者 2 只 
出 左 的 纯 战 略 可 表示 为 混合 战略 (1,0,0)。 

更 为 一 般 地 ,假设 参与 者 i AK 个 纯 战 覆 : S = lsa ,sik {, 则 参与 者 
i 的 一 个 混合 战 赂 是 一 个 概率 分 布 (pn,…, pa) 其 中 pa 表示 对 所 有 = 
1,…, K ,参与 者 i 选择 战略 ;4 的 概率 , 由 于 pi 是 一 个 概率 ,对 所 有 让 =1， 
"=, K, H OS pai H patt pr = 二 1。 我们 用 p: ETET S 的 任意 一 
个 混合 战略 ,其 中 包 人 各 了 选择 每 一 个 纯 战 略 的 概率 ,正如 我 们 用 s ER S 
内 任意 一 个 纯 战略 。 


SE MZ 对 标准 式 捕 弈 G= IS, tery Saitis etta u.l, Ri S; 一 1 Sit> an 
six fo 那么 ， 参与 者 I 的 一 个 混合 战略 为 概率 分 布 p; = CPi. os px), 其 中 
对 所 有 k=1, =>, K, 0S pai, pate t prle 


作为 本 节 的 一 个 小 结 . 我 们 简单 地 回顾 一 下 第 1.1.8 节 中 介绍 的 严格 
劣 战略 , 并 说 明 混 合 战 略 对 那里 的 论证 所 起 的 潜在 作用 。 当 时 讲 到 , 如 果 战 
略 s 为 严格 劣 战略 ,那么 参与 者 i 不 可 能 作出 这 样 的 推断 (针对 其 他 参与 
者 的 战略 选择 ), 他 的 最 优 反应 战略 会 是 ;;。 和 如 果 我 们 引入 混合 战略 , 就 可 
证 明 其 逆 命 题 ; 如 果 ( 针 对 其 他 参与 者 的 战略 选择 ) 参 与 者 都 不 可 能 作出 
这 样 的 推断 , 即 其 战略 s 会 成 为 最 优 反 应 战略 , 则 一 定 存 在 另 一 战略 严格 
HF so 1.3.1 和 图 1.3.2 所 示 博 弈 说 明了 如 果 我 们 只 讨论 十 战略 , 这 
一 逆 命 题 是 不 成 立 的 。 


O AAW Pearce, 1984) 在 两 人 博弈 中 证 明了 这 一 结论 , HERES SS CHES A fi 
许 相 关 的 条 件 下 ,该 结论 在 n 人 博弈 中 同样 成 立 , 即 必须 允许 参与 者 半 对 参与 者 j 行动 的 推断 与 其 
对 参与 者 x 行动 的 推断 相关 。 和 与 院 (987) 提 出 这 样 的 相关 性 在 : OP BIER BY, Se j 
和 点 完全 独立 地 必 出 选择 的 情况 下 。 例 如 , i 可 能 会 知道 和 +* 都 要 去 商学 院 , 或 也 许 去 同一 所 商 
学 院 , 世 也 许 不 会 知道 那里 面 教授 升 么 课程 。 
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Al 1.3.1 


1.3.1 显示 出 ,一 个 给 定 的 纯 战 略 可 能 会 严格 步 于 一 个 混合 战略 , 即 
使 这 个 纯 战 略 并 不 严格 尘 于 其 他 任何 一 个 纯 战 略 。 在 这 一 博弈 中 , 针对 参 
与 人 1 对 参与 人 2 可 能 行动 所 作出 的 任何 推断 (9,1 一 9),1 ARRENE 
As TCE g2 1/2), ELE M (在 g 委 172 时 ), 但 不 会 是 BL BRT XK 
M 都 不 产 格 优 于 BB。 这 里 的 关键 在 于 B 是 TT 和 MM 的 一 个 混合 战略 的 严格 
FRR: WESSE 1 以 1/2 的 概率 出 全 ,以 172 的 概率 出 MM, 则 其 期 望 收 
益 为 3/2, 不 管 2 将 会 选择 什么 ( 纯 的 或 泥 合 的 ) 战 略 , 3/2 都 大 于 选择 B 时 
将 得 到 的 收益 1。 这 个 例子 说 明了 在 “寻找 另外 一 个 严格 优 于 的 战略 ”时 ， 
混合 战略 所 起 的 作用 。 


类 与 人 人 2 


图 1.3.2 


图 1.3.2 说 明了 一 个 给 定 的 纯 战 略 可 以 是 针对 一 个 混合 战略 的 最 饮 反 
应 ,即使 这 一 纯 战 略 并 不 是 对 方 任何 一 个 纯 战 略 的 最 优 反应 。 在 此 博弈 中 ， 
对 参与 人 2 的 纯 战 略 LMR 来 说 ， 参 与 人 1 的 最 优 反应 都 不 是 互 ， 但 如 
却 是 针对 参与 人 2 的 混合 战略 (g, 1-¢), 4 1/3<9<2/3HB5A 1 
的 最 佐 反 应 。 这 一 例子 说 明了 混合 战略 在 “参与 者 i 可 能 持 有 的 推断 ”中 
的 作用 。 


1.3.8 纳什 均衡 的 存在 性 


本 节 讨 论 和 纳什 均衡 的 存在 性 相关 的 几 个 问题 。 第 一 , 我 们 把 第 
1.1.C 节 中 纳什 均衡 的 定义 扩展 到 包含 混合 战略 的 情况 ;第 二 , 我 们 应 用 这 
一 扩展 后 的 定义 求解 猜 硬 币 博弈 和 性 别 战 博弈 的 纳什 均衡 ;第 三 , 我 们 用 图 
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示 的 方法 证 明 任 何 一 个 参与 者 有 了 两 个 纯 战 略 的 两 人 博弈 都 存在 纳什 均衡 
(可 能 包含 了 混合 成 略 ); 最 后 ,给 出 并 讨论 纳什 定理 (1950), 它 保证 了 在 任 
何 有 限 博弈 ( 即 有 限 个 参与 者 , 并 且 每 个 参与 者 可 选择 的 纯 战 略 有 限 的 所 有 
博弈 ) 中 , 都 存在 纳什 均衡 ( 仍 可 能 会 包含 混合 战略 )。 

回顾 第 1.1.C 节 给 出 的 纳什 均衡 定义 ,保证 了 每 一 参与 者 的 纯 战 略 都 
是 其 他 参与 者 纯 战 略 的 最 优 反 应 战略 。 为 把 这 一 定 尺 扩展 到 包含 混合 战 
略 的 情况 , 我 们 只 需要 求 每 一 参与 者 的 混合 战略 是 其 他 参与 者 混合 战略 
的 最 优 反 应 。 由 于 任何 纯 战 略 都 可 表示 为 混合 战略 一 一 只 要 令 该 参与 
者 所 有 其 他 纯 战 略 出 现 的 概率 等 于 0 扩展 后 的 定义 完全 包括 了 前 
一 定义 。 

对 参与 者 i 来 讲 , 参与 者 ; 的 混合 战略 代表 了 他 对 j 将 选择 战略 的 不 
确定 性 , 并 据 此 计算 参与 者 : 对 ; 混合 战略 的 最 优 反应 。 我 们 先 以 猜 硬 币 
博弈 为 例 , 假定 参与 者 在 推断 参与 者 2 会 以 9 的 概率 出 正面 ,以 1- g 的 概 
率 出 背面 , 亦 即 参与 者 1 推断 参与 者 2 将 使 用 湿 合 战略 (g,t - 9)。 据 此 推 
断 , 和 参与 者 1 出 正面 可 得 的 期 望 收益 为 ge(-1l)+fi-a)1=1-29, 出 背 
MAS RAW ae A ge 1 t+ (1-9¢)€-1)=2¢-1. WTH g<1/2 时 ,1 
-2q >24 -1, Mf ¢<1/2N, B55 1 的 最 优 纯 战 略为 出 正面 ;g > 1/2 时 
为 出 背面 ; 当 g = 1/2 时 ,参与 者 1 出 霸 一 面 都 是 无 差异 的 。 余 下 的 就 是 参 
与 者 1 可 能 的 混合 战略 反应 。 

令 (r,1-r) 表 示 参 与 者 1 的 混合 战略 ,其 出 正面 的 概率 为 +, 对 任意 0 
到 1 之 间 的 4, 现在 我 们 计算 r 的 值 , 用 ”~ OET, AMC >,1- >) 为 参 
与 者 2 选择 (gq,1 一 9g) 时 参与 者 1 的 最 优 反应 ,其 结果 可 以 表示 为 图 1.3.3。 
当 参 与 者 2 选择 (e,1- 9) 时 ,参与 者 1 选择 (r,1- r) 的 期 望 收 益 为 ; 

ral- Dtr- a t+t-r)g 1+t-r-o9) -TD 
=(2¢+1)+r(2—-4q} (1.3.1) 
其 中 ,rg ECE, EMARE, r1- oE EN, 背面) 的 概率 , 如 此 等 
等 .和 由 于 参与 者 工 的 期 望 收益 在 2-4a>0 时 随 ritit E2- 4go RE 
r 递减 , 则 如 果 ¢<1/2,6548 1 的 最 优 反 应 为 >=1 即 出 正面 ); 如 果 g> 
1/2, 参与 者 1 的 最 优 反 应 为 r =0{ 即 出 背面 ), 如 图 1.3.3 所 示 r+" (q) PUR 


T MRE A 且 B)= PER A) x E(B), WE A 和 日 是 独立 的 。 那 么 ,在 用 ng 表示 1 
出 正面 同时 2 也 出 正面 时 , RERA TRE 1 和 2 相互 独立 地 进行 选择 ,这 与 我 们 对 同时 行动 博 
弈 的 限定 是 一 致 的 。 和 参见 与 曼 (1974) 对 相关 均衡 的 定义 , 官 应 用 于 参与 者 的 选择 可 以 相关 的 博弈 。 
{由 于 参与 者 在 选择 战略 之 前 观察 到 一 个 随机 结果 , 比如 请 币 在 桌面 上 的 转动 。) 
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水 平 虚线 。 这 一 表述 比 上 面 非常 相近 的 表述 条 件 要 强 : 那 里 我 们 只 考虑 纯 
战略 ,并 发 现 如 果 4g< 172, 正面 为 最 优 纯 战 略 ,如 果 g > 1/2, 背面 为 最 优 纯 
战略 ;这 里 我 们 考虑 所 有 的 纯 战 略 和 混合 战略 ,同样 发 现 如 果 g< 1/2, 正面 
是 所 有 战略 (包含 纯 战 略 和 混合 战略 ) 中 的 最 优选 择 , 如 果 g > 172, 背面 是 
所 有 战略 中 最 优 的 。 


(正面 ) 1 


(Witt) 


(We) 【正面 ) 
图 1.3.3 


当 g= 1/2 时 ,参与 者 对 (gq,1 一 g) 最 优 反 应 的 性 质 有 所 变化 。 前 面 已 
HER, E g=1/2 时 ,参与 者 1 选择 纯 战略 正面 或 背面 是 无 差异 的 。 而 
A, 因为 参与 者 1 在 (1.3.1) 中 的 期 望 收 益 在 y=1/2 时 与 7 AX, 所 有 混 
合 战 略 (x ,1 一 r+) 对 1 都 是 无 差异 的 。 也 就 是 说 , 当 gq = 1/2 时 ,对 于 0 到 1 
之 间 的 任何 +, BARB Cr, 1 一 +) 都 是 (g, 1 一 gq) 的 最 优 反应 。 那 么 ,+" 
(1/2) 就 是 [0, 1] 间 的 整个 区 间 , 即 图 1.3.3 所 示 Cg) PR ERE. Æ 
第 1.2.A 节 分 析 古 诺 模 型 时 , 我们 称 ri(9i) 为 企业 Ii 的 最 优 反应 函 玖 。 在 
这 里 ,因为 存在 一 个 g 的 值 , 使 r* (gq) 有 不 止 一 个 解 , 我们 称 ~ “(gq ) 为 参与 
者 1 的 最 优 皮 应 对 应 (best-response correspondence)。 

为 在 更 为 一 般 的 条 件 下 推导 出 参与 者 i 对 参与 者 j 混合 战略 的 最 优 反 
应 , 进一步 给 出 扩展 的 纳什 均衡 的 正式 定义 ,我 们 首先 分 析 两 个 参与 者 的 情 
况 , 从 而 可 以 通过 最 简单 的 方式 说 明 主 要 思想 。 令 了 表示 Si 中 包含 纯 战 略 
的 个 数 , K 表示 S, 包含 纯 战 略 的 个 数 , 则 Sy = fsa tosl S25 tsa, 
sox}, RRA 51,40 52, 33 SIR A SS 中 任意 一 个 纯 战 略 。 

如 果 参 与 者 1 推断 参与 者 2 将 以 (pa +s pz4) 的 概率 选择 战略 (sz1， 
w, po) WBF 1 选择 纯 战 略 sy 的 期 望 收益 为 ， 
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K 
Dy Paar say» s24) , (1.3.2) 
且 参 与 者 1 选择 混合 战略 Pif pu. py) 的 期 望 收 益 为 : 


; K 
vit Pi, Pz) = D pul D pzu son) | 
pel k= 


i K 
= 24 Da Pai * Prater si sa) - (1.3.3) 


其 中 , pi x pre 表示 参与 者 选择 su 且 参 与 者 2 选择 so, 的 概率 。 根 据 
(1.3.3), 参与 者 1 选择 混合 战略 Pi 的 期 望 收 益 , 等 于 按 (1.3.2) 给 出 的 每 
一 个 纯 战 略 1st say) 的 期 望 收益 和 的 加 权 和 , 其 权重 分 别 为 各 自 的 概率 
CPi, Pu), A, BSF 1 的 混合 战略 (p14,…， Pu) 要 成 为 他 对 参与 者 
2 战略 Po 的 最 优 反应 ,其 中 任何 大 于 0 的 pi 相对 应 的 纯 战 略 必 须 满足 ; 


K K 
2a Poal su Sze) = 2a Powe C815 + 524) 


MS, 中 每 一 个 3 都 成 立 。 这 表明 ,一 个 混合 战略 要 成 为 Po 的 最 优 反应 ， 
ESR PE TRERAT 0 的 纯 战 略 本 身 也 必须 是 对 PL 的 最 优 反应 。 反 
AKH, 如 果 参 与 者 1 有 个 纯 战 略 都 荐 PP; 的 最 优 反 应 , 则 这 些 纯 战 略 全 部 
或 部 分 的 任意 线性 组 合 ( 同 时 其 他 纯 战略 的 概率 为 0) 形成 的 混合 战略 同样 
是 参与 者 1 对 Po 的 最 优 反 应 。 

为 给 册 扩 展 的 纳什 均衡 的 正式 定义 , 我 们 还 需要 计算 当 参 与 者 1 和 2 
分 别 选 择 混 合 战略 Pi 和 P 时 参与 者 2 的 期 望 收 益 。 如 果 参 与 者 2 推断 参与 
者 1 将 分 别 以 (p11,…, 记 Pw) 的 概率 选择 战略 1s51， es spl, BA 2 SP Sl 
UR pn, . Pos) 选择 成 略 (s21,…, sz》 时 的 期 望 收益 为 


K 


I 
val Pi. Pa) = Z Pal Dy piual ss s24)] 
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件 , 即 每 一 参与 者 的 混合 战略 是 另 一 参与 者 瀑 合 战略 的 最 优 反应 :一 对 混合 
战略 (PY , P2 ) 要 成 为 纳什 均衡 , PY 必须 满足 


vAPr,P2) 2 oC Py, PI). (1.3.4) 
对 Si 中 战略 所 有 可 能 的 概率 分 布 Pi 都 成立 , 并且 P 必须 满足 
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val Py, Py ) vt PY, P2) , (1.3.5) 
对 Sy PRERA BD ES Pa 都 成 立 。 


定义 ”在 两 个 参与 者 标准 式 博弈 G = |5, Szun #2| 中 ,混合 战略 
CPE, P? ) 是 纳什 均衡 的 充 要 条 忻 为 :每 一 参与 者 的 沦 合 战略 是 另 一 参与 者 
混合 战略 的 最 优 反 应 , 即 (1.3.4) 和 (1.3.5) 必 须 同 时 成 立 。 


下 面 我 们 用 这 一 定义 分 析 猜 硬币 博弈 和 性 吊 战 博弈 , 为 此 , 我们 运用 图 
1.3.3 中 介绍 的 图 未 法 ,把 参与 者 i 对 参与 者 混合 战略 的 最 优 反 应 在 图 上 
表示 出 来 。 为 完成 图 1.3.3 的 内 容 ,还 需 计 算 最 优 的 g E, g(r) RM, 
从 而 使 (q,1 一 9g) 成 为 参与 者 2 对 参与 者 1 战略 (rr, 1 一 r) 的 最 优 反 应 。 绪 
im 1.3.4 所 示 , 如 果 ~ 和 172, 则 2 的 最 优 反应 为 背面 ,于 是 9 "(rr)=0; 
相似 地 ,如果 rr>>1/2, 则 2 的 最 优 反 应 是 正面 ,于 是 gq*(r)=1。 Mr = 
172, 则 不 仅 参 与 者 2 出 正面 和 出 背面 是 无 差别 的 , 而 且 对 其 所 有 混合 战略 
(ca,1-4) 也 都 完全 相同 ,于 是 a* (1/2) 为 整个 区 间 [0, 1]。 


(8m) 


(背面 》 (Em) 


图 1.3.4 


把 图 1.3.4 的 维 轴 和 横 轴 互 换 并 旋转 ， 我 们 得 到 图 1.3.5。 单 纯 表 示 
参与 者 2 对 参与 者 1 混合 战略 的 最 优 和 及 应 ， 图 1.3.5 不 如 图 1.3.4 EWE 
现 ， 但 它 可 与 图 1.3.3 合并 成 图 1.3.6。 图 1.3.6 和 第 1.2.A 节 分 析 古 诺 
模型 时 的 图 1.2.1 相 类 做， 正如 那里 的 最 优 反 应 郴 数 > Cg) Wer, Cga) 
的 交点 确定 了 古 诺 博弈 的 纳什 均衡 ， 在 这 里 最 优 反 应对 应 r” (gqg) Mg” 
(r) 的 交点 给 出 了 猜 硬 币 博弈 的 混合 战略 纳什 均衡 : 如 果 和 参与 者 i HR 
略 是 〈172，i72), 则 参与 者 j 的 最 优 反 应 为 (1/2，1/2)， 它 满足 纳什 均 
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衡 的 要 求 。 


(Fim) 


(背面 } GED) 


(WED 


(FED 《正面 ) 
图 1.3.6 


应 该 强调 的 是 ,这 样 一 个 混合 战略 纳什 均衡 并 不 是 建立 在 任何 参与 者 
扔 硬币 、 掷 骨 子 或 其 他 随机 选择 行为 的 基础 之 上 , 我 们 可 以 把 参与 者 j 的 混 
合 战略 解释 为 参与 者 ; 对 参与 者 7 将 会 选择 哪 一 个 ( 纯 ) 战 略 的 不 确定 性 。 
例如 在 棒球 比赛 中 , 投球 手 也 许 是 基于 以 往 投球 的 成 功率 决定 是 投 快速 直 
线 球 还 是 投 曲 线 球 。 如 果 击 球 手 了 解 投 球 手 是 如 何 选择 的 ,但 并 不 能 观察 
到 他 以 往 的 成 功率 ,那么 击 球 手 就 可 能 会 推断 投球 手 投 出 快 球 和 投 出 直线 
球 的 可 能 性 是 相等 的 。 这 时 我 们 把 击 球 手 的 推断 表示 为 投球 手 采 取 混 合 战 
RE (1/2, 1/2), 而 事实 上 投球 手 是 基于 击 球 手 所 不 了 解 的 信息 选择 一 个 纯 战 
略 。 更 为 一 般 地 讲 , 我 们 可 以 理解 为 参与 者 j 被 赋 子 了 一 小 点 儿 内 部 信息 ， 
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基于 他 所 掌握 的 内 部 信息 , 参与 者 j BS eR. OR 
过 , 由 于 参与 者 ; 并 不 能 观测 到 ; 的 私人 信息 ,i 并 不 能 确定 ; 的 选择 , 我 们 
用 j 的 混合 战略 表示 i 的 这 种 不 确定 性 。 在 第 3.2.A 节 , 我 们 还 将 为 这 种 
对 混合 战略 的 解释 提供 更 为 正式 的 表述 。 

作为 混合 战略 纳什 均衡 的 第 二 个 例子 ， 考 续 第 1.1.C 节 中 的 性 别 战 
博弈 ， 令 〈g，1- g) 为 帕 特 的 一 个 混合 战略 ， 其 中 他 选择 歌剧 的 概率 为 
q BS (r, 1-r) 为 克 里 斯 的 一 个 混合 战略 ， 其 中 他 选择 歌剧 的 概率 
为 +。 如 果 帕 特 的 战略 为 (g,1 -ga), 则 克 里 斯 选 择 可 剧 的 期 望 收 益 为 gx2 
+(1—-q¢)X0=2¢, 27 GHB RA g <¥O0+(1-¢g)X1=l-¢, M 
而 ,在 >173 时, 克 里 斯 的 最 优 反应 为 歌剧 ( 即 =1)39¢<1/3 时 , ve 
的 最 优 反 应 为 源 击 ( 即 >=#=0)5g=173 时 ,任何 可 行 的 + RR, X 
Wibe, 如果 克 里 斯 的 战略 为 (r,1- r), 则 帕 特 选 择 歌剧 的 期 望 收 益 为 >Xx1 
+{tLt -rr)7xN0=>, 选 择 拳 击 的 期 望 收 益 为 rx0O+(1-r)yx2= 2(1-r)s 
从 而 ,+>2/3 时 , 帕 特 的 最 优 反应 是 歌剧 ( 即 g =1)37<2/3 时 , 粕 特 的 最 
做 反 应 是 拳击 ( 即 g = 0),r =2/3 时 ,任何 可 行 的 gq 值 都 是 最 优 反 应 。 如 图 
1.3.7 所 示 , 最 优 反 应 对 应 的 交点 之 一 ,有 即 帕 特 的 混合 战略 tg,1 一 gqg)= 
(1/3,2/3) 与 克 里 斯 的 混合 战略 (x, 1 一 +) = (2/3,1/3) 就 是 原 博 穿 的 一 个 
纳什 均衡。 


(3a) 


(2) (EE) 
B 1.3.7 


本 例 和 图 1.3.6 的 不 同 之 处 在 于 ,后 者 两 位 参与 者 的 最 优 反 应 对 应 只 
有 一 个 交点 ,图 1.3.7 中 (gq) 和 gq"(r) 有 三 个 交点 :tg=0,r=0)、(gq = 
1, 了 =1) 及 (g=1/3,r=2/3)。 另 外 两 个 交点 分 别人 代表 了 第 1.1.C 节 讲 过 
的 两 个 纯 战 覆 纳 什 均衡 (党 击 、. 涯 击 ) 和 (歌剧 ,歌剧 )。 
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FE CE RSE, — PRA (RS AE AR 2S a) BB RE 
参与 者 问 最 优 反 应 对 应 的 一 个 交点 ,即使 该 博弈 前 参与 者 在 两 人 以 上 ,或 有 
些 或 全 部 参与 者 有 两 个 以 上 的 纯 战 略 。 不 过 遗憾 的 是 , 惟一 一 种 可 以 用 图 
形 简明 表示 出 参与 者 之 间 最 优 反 应 对 应 的 博弈 , 就 是 上 面 介 绍 的 每 个 参与 
者 只 有 两 个 纯 战 略 的 两 人 人 博弈。 下 面 我 们 用 图 示 法 论证 任何 这 种 两 人 博弈 
都 存在 纳什 均衡 (可 能 包含 了 混合 战略 ) 。 


#5A2 


ent 
+ Ces [we | 


E 1.3.8 


考虑 图 1.3.8 给 出 的 参与 者 1 的 收益 情况 。z= 和 x,y 和 ww 各自 的 相 
对 大 小 对 博 奔 的 结果 十 分 重要 ， 由 此 可 以 分 为 以 下 四 种 主要 情况 : Gi) x 
>z By>w, Gi) rz Hyw, Gü) 2 >< Hy<w, (iv) <x By 
>>w。 我 们 首先 讨论 这 四 种 主要 情况 ， 然 后 再 分 析 涉 及 r= z Ry = w 
的 情况 。 


图 1.3.9 


对 参与 者 1, 在 情况 (中 ,上 严格 乱 于 下 ;在 情况 (让 中 ,下 严格 优 于 上 。 

根据 前 面 讲 过 的 严格 省 战略 定义 ; 当 且 仅 当 参与 者 i( 对 其 他 和 参与 者 所 选择 
的 战略 ) 不 能 作出 这 样 的 推断 ,使 选择 战略 s BAY, Bs, 为 严格 劣 
战略 。 因 此 ,如 果 (g, 1 一 g) 是 参与 者 2 的 一 个 混合 战略 , 其 中 g 为 2 选择 
左 的 概率 ,那么 在 情况 (i) 中 ,没有 9 能 使 参与 者 1 选择 下 成 为 最 优 ,并 且 在 
情况 Gi) 中 ,没有 g 能 使 1 选择 上 成 为 最 优 。 令 (rr,1- rr) 表示 参与 者 1 二 的 
一 个 混合 战略 , 其 中 是 1 选择 上 的 概率 , 我们 可 以 在 图 1.3.9 中 分 别 表 
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AUP COA Ci) FRR RO. CE AAEN RE 
应 对 应 事实 上 也 是 最 优 反 应 函数 ,因为 没有 g 值 使 得 参与 者 1 用 个 最 
RE.) 


r 
CE) 3 


CF) I r 


E) CH?) 
情况 Civ》 


Fl 1.3.10 


在 情况 (iii) 和 情况 (iv) 中 , 上 和 下 都 不 是 严格 劣 战 略 ,那么 ,必定 对 某 些 
q 值 ,选择 上 是 最 优 的 ,对 另 一 些 g 值 ,选择 下 是 最 优 的 。 令 9 woy) 
tr 一 x+ ww 一 y), 那 么 在 情况 Gi 中 ,g >>g 时 上 是 最 优 的 , q< i FR; 
而 在 (iv) 中 则 相反 。 在 两 种 情况 下 ,g =q 时 ,任何 可 行 的 x 都 是 最 优 的 。 
这 两 种 情况 的 最 优 反 应 对 应 由 图 1.3.10 给 出 。 

HF x= z it, g =1, 0 y= w ti, g =O, RRA c= wyw i 
ERF, RRENA L AR E TE JE SY KH) RATT 
设想 图 1.3.10 PGi) iv). Æ g =0 È g =1 时 的 情况 。 

EA 1.3.8 中 分 别 如 入 任意 的 参与 者 2 ee, BUS Lm 
计算 可 得 同样 的 四 个 最 优 反 应 对 应 , 只 不 过 与 图 1.3.4 相同 ,水 平 轴 代 表 > 
和信, 而 纵 轴 代 表 g A. HOA 1.3.4 到 1.3.5 同样 的 处 理 , 旋转 这 四 个 图 形 的 
坐标 系 ,可 以 得 到 图 1.3.11 积 图 1.3.12( 在 图 1.3.12 中 ,对 r+’ 的 定义 与 图 
1.3.10 中 g M) 

决定 性 的 一 点 在 于 , 错 定 参与 者 1 的 四 种 最 优 反 应 对 应 的 插 何 一 种 , 即 
图 1.3.9 或 图 1.3.10 中 的 任何 一 条 rr* (9g), 及 参与 者 2 的 任何 四 种 之 一 ， 
BPA 1.3.11 或 图 1.3.12 中 的 任何 一 条 gq* (7), 这 一 组 最 优 反 应 对 应 至 少 
有 一 个 交点 ,于 是 搏弈 至 少 有 一 个 纳什 均衡 , 对 16 种 可 能 的 最 居 反 应 对 应 
组 合 情 况 进行 逐一 检验 ,我 们 留 在 习题 中 进行 。 这 里 只 定性 地 给 出 可 以 得 
到 的 结论 。 可 能 出 现 的 情况 有 :(1) 惟 一 的 纯 战 略 纳 什 均衡 , (2) 惟 一 的 混合 
REAA, (3)? 两 个 纯 战 略 纳什 的 衡 儿 一 个 混合 战略 纳什 均 生 。 前 面 讲 
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过 的 图 1.3.6 的 猜 硬 币 博弈 是 第 二 种 情况 的 一 个 例 了 于 ,图 1.3.7 BOE TE 
博 旗 是 第 三 种 情况 的 一 个 例子 。 因 秆 困境 则 属于 第 一 种 情况 , CEM r” 
(OHORGA gq (rr) 的 们 或 (i 结合 产生 的 。? 


CE) 1 CE) 1} 


CF) CF) 


CF) 


1.3.12 


本 节 的 最 后 ,我 们 讨论 在 更 为 一 般 的 博弈 中 纳什 均衡 的 存在 性 。 如 果 
上 面 关于 两 人 两 个 纯 战 略 博弈 的 论证 不 使 用 图 示 的 方法 ,而 用 数学 方法 , 则 
可 以 适用 于 一 般 的 在 意 有 限 战略 空间 的 = 人 博弈 。 


定理 (纳什 ,1950): 在 n 个 参与 者 的 标准 式 博 窃 G= Si Spit 


D AA r=: Ay w 时 的 情况 并 不 违背 一 组 最 扰 反 位 对 应 至 少 有 一 个 交点 的 结论 。 相 有 反 ， 
除 韦 中 讲 到 的 那 3 种 情况 外 , 还 可 能 存在 两 个 纯 战 略 纳 什 均 疾 无 混合 战略 纳 秆 均 生 以 及 连续 的 纳 
什 均衡 的 情况 。 
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ua, UR = 是 有 限 的 , te i, S: 是 有 限 的 , 则 博弈 存在 至 少 一 
个 纳什 均衡 ,均衡 可 能 包含 混合 战略 。 


fix) 


Fl 1.3.13 


纳什 定理 的 证 明 要 用 到 不 动 点 定理 。 作 为 不 动 点 定理 的 一 个 简单 例 
F, BE ALz) 是 一 个 定义 域 和 值 域 都 在 10,1] 之 间 的 连续 函数 , 则 布 劳 尔 
{Brouwer) 的 不 动 点 定理 保证 了 存在 至 少 一 个 固定 的 点 一 一 即 在 [0, 1] 中 存 
在 至 少 一 个 值 xz" ,使 f(x"')=x*。 图 1.3.13 纵 出 了 一 个 例子 。 

运用 不 动 点 定理 证 明 纳什 定理 包含 两 个 步骤 ;(1) 证 明 一 个 特定 对 应 上 
的 任何 不 动 点 都 是 纳什 均 衙 ;(2) 使 用 一 个 恰当 的 不 动 点 定理 证 明 这 一 对 应 
一 定 有 一 个 不 动 点 。 这 里 所 说 的 对 应 指 n 人 最 优 反 应 对 应 , Bria“ 
的 不 动 点 定理 "应 归功 于 角 谷 {Kakutani，1941), 他 将 布 劳 尔 的 定理 从 函数 
推广 到 {符合 一 定 条 件 的 } 对 应 。 

n 大 最 优 反 应 对 应 由 个 单个 参与 人 的 最 优 反应 对 应 通过 下 述 计 算得 
出 :考虑 任意 的 一 个 混合 战略 组 全 (pl Pp,), 对 每 一 个 参与 者 i, 求 出 z 
针对 其 他 参与 者 混合 战略 (p41,…, Pi- Pie > PRA RM. Re 
建 每 一 参与 者 一 个 上 述 最 优 反 应 的 所 有 可 能 组 合 的 集合 { 正 滤 地 说 , 即 导出 
每 一 参与 者 的 最 优 反 应 对 应 , 然后 构建 这 = 个 参与 者 最 优 反 应 对 应 的 交叉 
积 { 币 卡尔 积 ))。 一 个 混合 战略 组 合 ( pf ,…, pr ) 是 这 一 对 应 集中 的 不 动 
点 , 如果 (Cp? ,…, P RF BRAM (plo, pe ) 的 最 优 反 应 的 所 有 可 能 
组 合 的 集合 。 即 , 对 每 个 i, p? DABS SH Mel. plea Pie, 
的 最 优 反 旗 ( 之 一 ), 这 又 恰好 符合 纳什 均衡 的 条 件 , 即 ( 记 ” ,…, pe ) 是 
一 个 纳什 均衡 。 这 就 完成 了 第 (1) 步 。 

第 (2) 步 的 证 明 要 用 到 每 一 参与 者 的 最 优 反 应 对 应 都 在 某 种 条 件 下 连 
续 这 一 事实 。 在 布 劳 尔 的 不 动 点 定理 中 连续 性 的 作用 可 在 图 1.3.13 构建 
的 f(z) 看 出 ;如 果 Mea) BERN, 不 动 点 就 不 一 定 存 在 。 例 如 在 图 
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1.3.14 


1.3.14 中 ,对 所 有 x 过 x, fc) >x. {At rar, flr) r oo 为 理解 图 
1.3.14 中 的 f(z) 和 参与 者 的 最 优 反 应 对 应 的 不 同 之 处 , 考虑 图 1.3.10 中 
ARN): g= g 时,r ”fg) 包 括 了 0.1 以 及 中 间 整 个 区 间 ( 稍 微 正 式 
一 点 表述 , 即 rr* (gq) 包括 了 当 g MEMI g ATL’ (9) 的 极限 ,以 及 a 
MAWE g E, x“ (9) 的 极限 ,并 且 包 括 这 两 个 极限 之 间 的 所 有 r 值 )。 
如 果 图 1.3.14 中 f(zr') 要 成 为 类 似 的 参与 者 1 的 最 优 反应 对 应 > lgh 
则 f(x) 的 值 不 仅 祥 包含 实心 点 (如 图 所 示 }), 还 应 包含 空心 点 及 整个 虚线 
区 间 , 这 时 f(x) 就 会 在 x "有 一 个 不 动 点 。 

每 个 参与 者 的 最 优 反应 对 应 总 是 如 图 1.3.10 ARB r* (gq ); 它 总 是 
包括 ( 借 昨 的 一 般 意 六 上 的 ) 从 堪 侧 的 极 狠 .从 右 刷 的 极限 以 及 其 间 的 所 有 
值 。 其 原因 在 前 面 讨 论 两 个 参与 者 的 情况 时 已 经 证 明 : 如 果 参 与 者 主 有 = 
个 纯 战 略 都 是 其 他 参与 者 混合 战 赂 的 最 优 反 应 , 则 参与 者 i 的 这 些 最 优 纯 
战略 的 任意 报 率 的 线性 组 合 ( 并 令 其 他 纯 战 略 的 概率 为 0) 得 到 的 混合 战略 
P; 亦 是 参与 者 i 的 最 优 反应 。 由 于 每 一 参与 者 前 最 优 反 应 对 应 总 有 是 具有 
这 一 特性 , n 人 最 优 反 应 对 应 亦 具 有 这 一 特性 :这 就 满足 了 角 和 谷 的 假定 , F 
是 ”大 最 优 反 应 对 应 有 一 个 不 动 点 。 

纳什 定理 保证 了 相当 广泛 种 类 博弈 中 均衡 的 存在 性 ,但 第 1.2 节 应 用 
举例 所 分 析 的 博弈 却 不 在 此 列 (因为 每 一 参与 者 的 战略 空间 都 是 无 限 的 )。 
这 说 明 纳 什 定理 中 的 俱 定 是 均衡 存在 性 的 充分 条件 , 却 不 是 必要 条 件 一 一 
膛 有 许 老 博弈 , 虽 不 满足 定理 假定 的 条 件 , 却 同 样 存 在 一 个 或 多 个 纳什 和 坪 
衡 。 


© fs 的 村 由 实 点 央 定 ,空心 点 甫 示 六 x DF BSR fh. PROBA ARR z= 工时 ， 
可 能 取 到 两 个 点 的 值 , 划 不 代表 也 会 取 狩 中 国 任 何 一 点 的 倘 。 
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1.4 进一步 阅读 


关于 重复 副 除 严格 先 战 略 和 纳什 均衡 的 很 定 , 及 借用 参与 者 的 推断 来 
RRG Kees. BH SIR (1992), KF HAR eA A ER 
BA TF HED) ELARA AR, SREB SMHS 
(Scheikman, 1983), 他 们 证 明 在 某 些 条 件 下 , 企业 面临 生产 能 力 的 约束 时 
《企业 在 选择 价 覆 之 前 ,要 付出 一 定 成 本 选择 生产 能 力 ), 贝 特 兰 德 型 模型 会 
出 现 古 诺 模 型 的 结果 。 关 于 仲裁 ,参见 吉本 斯 (Gibbons,1988), 他 说 明了 在 
最 后 要 价 仲裁 及 协议 伸 裁 中 , 仲裁 者 所 偏 好 的 方案 如 何 依赖 于 各 方 的 要 价 
中 所 包含 的 信息 。 最 后 ,关于 纳什 均衡 的 存在 性 , 包括 纯 战 略 在 战略 空间 中 
ESHA, 请 矢 考 达 斯 古 普 塔 和 马 斯 金 {Dasgupta & Maskin, 1986)。 


1.5 习题 与 练习 


第 1.1 7 

1.1 什么 是 博弈 的 标准 式 ” 在 博弈 的 标准 式 中 , 什么 是 严格 劣 战 略 ? 
什么 是 一 个 纯 战 赂 纳什 均衡 ? 

1.2 在 以 下 博弈 的 标准 式 中 , 电 些 战略 不 会 被 重复 噜 除 严 格 步 战略 所 
SBR? 纯 战 略 纳 什 均衡 又 是 什么 ? 


1.3 两 个 人 就 如 何 分 配 一 元 钱 进 行 谈 判 ,双方 同时 提出 各 自 希 望 得 到 
的 份额 ,分 别 为 sy 和 sa HOSs,, 521. 车 s+ 21, MOA ASAE 
们 所 要 的 一 份 ;如 果 si + so > 1, PT AS FC RR ee EB k 
略 纳什 均衡 。 
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1.4 人 根 定 古 诺 的 寡头 董 断 模型 中 有 n 个 企业 , ¢ 代表 企业 i 的 产 
量 , 卫 Q=g1+… + 9g, 表示 市 场 总 产量 , 表示 市 场 出 清 价 格 ,并 假设 反 需 
求 函 数 由 p(Q)=e-Q BHR. Q<a, AIRT p =0)。 并 设 企业 3; 
生产 出 gj HAREC) = cqj; 即 没有 固定 成 本 , 且 边 际 成 本 为 常数 c 这 
里 我 们 设 ca, RR GHHEE, 企业 同时 就 产量 进行 涩 策 。 求 出 博弈 的 
纳什 均 衔 。 当 = 趋 于 无 穷 时 ,将 会 发 生 什 么 情况 ? 

1.5 .考虑 以 下 两 个 十 谱 双 头 昔 断 模型 的 战略 宰 间 有 限 的 情况 。 第 一 ， 
假定 每 个 企业 必须 逃 择 要 么 生产 垄断 产 出 的 一 半 gmy72=(a — 0/4, BA 
Po ee Bg = (a - c)73, 任 何其 他 产量 都 是 不 允许 的 。 证 明 这 一 
非 此 即 彼 的 博弈 是 一 个 因 徒 困境 式 的 问题 ;每 一 个 企业 都 有 一 个 严格 劣 战 
略 ,并 及 在 均衡 状态 下 , 每 一 企业 的 福利 都 要 比 他 们 相互 合作 时 下 降 。 第 
二 ,假设 每 个 企业 可 以 选择 g,/2 或 和, 或 第 三 种 产量 og KRW a’ H 
值 , 使 得 这 一 博弈 在 以 下 方面 等 价 于 第 1.2.A 节 中 的 古 诺 模 型 , 即 (gq., g.) 
是 惟一 的 纳什 的 衡 , 并 且 在 均衡 状态 下 , 每 一 企业 的 福利 都 比 他 们 相互 合作 
时 要 低 ,但 两 个 企业 都 没有 严格 省 战略。 

1.6 考虑 在 古 诺 双 头 荃 断 模 型 中 , 反 需 求 函 数 为 p(Q)=4a 一 己 , 但 两 
企业 有 不 同 的 边际 成 本 , 企业 1 为 cu 企业 2 为 cz,* 求 出 当 每 个 企业 0< ec 
<a/2 时 的 纳什 均衡 。 如 果 ci< cz<a 人 但 2cz>a+cl 纳 什 均 衡 冯 有 什么 
变化 ? 

1.7 在 第 1.2.B 中 ,我 们 分 析 了 产品 有 差异 的 贝 特 兰 德 双 头 菊 断 模 
型 。 同 质 产品 的 情况 下 结论 是 十 分 明显 的 。 假 设 p< p; 时 ,消费 者 对 企业 
i 产品 的 需求 为 a — po pi> p; 时 为 0, p= pi Ala 一 p,)/2. ARBRE 
不 存在 固定 成 本 , 且 边 际 成 本 为 常数 c, 这 里 c < 之 a。 证 明 如 果 企 业 同 时 选 
择 价 格 , 则 惟一 的 纳什 均衡 就 是 每 个 企业 的 定价 均 为 c。 

1.8 设 有 一 批 选民 在 一 个 单位 区 间 从 左 (x = 0) BAe =1) 均 名 分 
布 ,为 一 个 职位 参加 竟 选 的 每 个 候选 人 同时 选择 其 竞选 基地 ( 即 在 x=0 到 
z=1 中 间 的 一 个 点 )。 选 民 观 察 收 选 人 的 选择 , 然后 每 一 投票 人 把 票 投 给 
其 基地 离 自己 最 近 的 候选 人 。 比 如 , MRA PRA, 他们 分 别 在 xz, = 
0.3 和 zz=0D.6 选 择 基地 ， 则 处 于 xz =0,45 左边 的 所 有 选民 都 会 把 票 投 给 
候选 人 1， 右边 的 人 都 会 把 票 投 给 候选 人 2. 这样 候选 人 2 就 可 以 得 到 
55% 的 选票 赢得 这 场 人 选举 。 假 设 候选 人 只 关 心 他 能 否 当 选 一 一 他 们 根本 上 
一 点 都 不 关心 其 基地 ! 如 果 有 两 个 候选 人 ， 博 弃 的 纯 战 略 纳什 均衡 是 什 
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A? 如 果 有 三 个 候选 人 ， 求 出 一 个 纳什 均衡 。 (假设 选择 局 一 个 基地 的 候 
选 人 将 平分 这 一 基地 可 得 的 选票 ， 得票 最 高 的 候选 人 不 止 一 人 时 ， 谁 当选 
HAERERE.) BLA TEAR (CHotelling, 1929) 关于 此 类 博弈 的 早期 
模型 。 


1.34 

1.9 什么 是 标准 式 博 弈 的 混合 战略 ? 什么 是 标准 式 博弈 的 混合 战略 
纳什 均衡 ? 

1.10 证 明 在 1.1 节 中 所 分 析 的 3 个 标准 式 博 穿 一 一 囚徒 困境 .图 
1.1.1 和 图 1.1.4 中 ,不 存在 混合 战略 纳什 均衡 。 

1.11 解 出 习题 1.2 所 给 博弈 的 混合 战略 纳什 均衡 。 

1.12 求 出 下 面 标 准 式 博弈 的 混合 战略 纳什 均衡。 


上 R 

T Zl 0,2 

B 1,2 3.0 
1.13 ATtEheA-TLESR, REELS HLA CRA 
AR EH ab IS GE, BARAR — PRR A): ek i 给 的 工资 为 w,;, 这 里 
C1/2uytwr.<2w,. 设想 有 两 个 工人 ,每 人 只 能 申请 一 份 工作 ,两 人 同时 
决定 是 申请 企业 1 的 工作 ,还 是 向 企业 2 申请 。 如 果 只 有 一 个 工人 向 一 个 
企业 申请 , 他 就 会 得 到 这 份 工 作 ; 和 如 果 催 个 工大 同时 疝 一 个 企业 申请 工作 ， 
则 企业 随机 选择 一 个 工人 , 另 一 人 就 会 失业 (这 时 收益 为 0)。 解 出 两 工人 


标准 式 博弈 的 纳什 均衡 。( 要 更 进一步 了 解 企业 是 如 何 决 定 工 资 的 ,请 参阅 
FEH Montgomery), 1991) 


EA2 


向 企业 1 申请 向 企业 2 申请 


mona 
TAI 


癌 企 业 2 a Wz, Uy 1/2, 1/22 


1.14 证 明 附 录 1.1.C 中 的 命题 B 不仅 对 纯 战略 成 立 , 对 混合 战 赂 同 
祥 成 立 : 在 混合 战略 纳什 均衡 中 , EKF 0 的 战略 一 定 不 会 被 重复 剔除 严 
ee ARS BR 
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本 章 介 绍 动态 博弈 。 我 们 仍 集 中 分 析 完 全 信息 的 博弈 { 即 参与 者 的 收 
益 函 数 是 共同 知识 的 博弈 }; 有 关 非 完全 信息 的 博 变 将 在 第 3 章 介绍 。 其 
中 第 2,1 节 分 析 完 全 且 完 美 信息 的 动态 博 守 ， 这 是 指 在 博弈 进行 的 每 一 步 
当中 ， 要 选择 行动 的 参与 者 都 知道 这 一 步 之 前 博弈 进行 的 整个 过 程 。 从 
第 2.2 节 到 第 2.4 节 ， 我 们 讨论 完全 但 不 完美 信息 博弈 : 在 博弈 的 某 
些 阶 毁 ， 要 选择 行动 的 参与 人 并 不 知道 在 这 一 步 立 前 博弈 进行 的 整个 
过 程 。 

所 有 动态 博弈 的 中 心间 题 是 可 信任 性 。 作 为 不 可 置信 的 威胁 的 一 个 例 
子 , 考 态 下 面 两 步 博弈 。 第 一 ,参与 者 1 选择 支付 1000 美元 钱 给 参与 者 2 
还 是 一 分 不 给 ;第 二 ,参与 者 2 观察 参与 者 1 的 选择 ,然后 决定 是 否 引 爆 一 - 
晒 手 雷 把 两 人 一 块 儿 炸 死 。 假 设 参 与 者 2 威胁 参与 者 1, 如 果 他 不 付 1000 
美元 就 引 旭 手雷 ,如 果 参 与 者 1 相信 这 一 威胁 , 他 的 最 优 反 应 是 支付 1000 
美元 .但 参与 者 1 却 不 会 对 这 一 威胁 信以为真 , 因为 它 不 可 置信 :如 果 给 参 
与 者 2 一 个 机 会 ,让 他 把 威 束 和 付 诺 实施 , 参与 者 2 也 不 会 选择 去 实施 它 , 这 
样 参 与 者 1 就 会 一 分 不 付 。 了 

第 2.1 节 分 析 如 下 类 型 完全 且 完 美 信息 的 动态 博弈 ;首先 参与 者 1 行 
动 ,参与 者 2 先 观察 到 参与 者 上 的 行动 , 然后 参与 者 2 行动 , 博 弃 结 来 。 手 
雷 博 蛮 即 属 这 一 类 型 , 斯 塔 克 尔 由 里 (1934) 的 双 头 垄断 模型 , PBR 
{Leontief, 1946) 的 有 工会 企业 中 的 工资 和 就 业 决 定 模 型 亦 属 这 一 类 博弈 。 
我 们 定义 此 类 博弈 的 道 向 归纳 解 (backwards-induction outcome) Ff MBH iC 
它 与 纳什 均衡 的 关系 (这 一 关系 的 详细 讨论 在 第 2.4 节 )。 作 为 例子 ,我 们 
解 出 在 斯 塔 克 尔 贝 里 各 里昂 惕 夫 模 型 中 的 逆向 归 钠 解 , 并 对 人 鲁 宾 斯 坦 (Ru- 


中 ”参与 者 1 可 能 会 考虑 威 娄 票 引 巢 手 健 的 对 手 不 是 个 疯子 。 这 种 怀 乡 在 模型 中 我 们 填 示 为 
不 完全 信息 一 一 参与 者 1 对 参与 者 2 的 收益 隔 数 站 不 确定 。 和 参见 第 3 章 。 
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binstein, 1982) Hit HIE Or ES eR, 尽管 后 面 的 博弈 有 潜在 
AFH ZEW, AIHA EASE. 

第 2.2 节 丰 富 了 前 一 节 分 析 的 博弈 类 型 :首先 参与 者 1 和 2 NTH, 
接着 参与 者 3 和 4 观察 到 1 和 2 选择 的 行动 ,然后 参与 者 3 和 4 同时 行动 ， 
博弈 结束 。 这 里 的 同时 行动 意味 着 此 类 博弈 有 不 完美 信息 (这 一 点 在 第 
2.4 节 将 进一步 给 出 解释 )。 我 们 定义 这 种 博弈 的 子 博弈 精炼 解 (subgame- 
perfect outcome}, 它 是 道 癌 归纳 方法 在 此 类 博弈 中 的 自然 延伸 。 在 应 用 举 
例 中 ,将 解 出 戴 蒙 德 和 过 布 维 格 (Diamond & Dybvig , 1983) 的 银行 挤 提 模 
型 、 按 齐 尔 和 罗 森 (Lazear & Rosen, 1981) 的 锦标 赛 模 型 的 结果 。 

第 2.3 PR BRB (repeated game)， 它 指 一 组 国定 的 参与 者 多 
次 重复 进行 同一 给 定 的 博弈 ， 并 且 在 下 次 博弈 开始 前 ， 参 与 者 都 可 以 观察 
到 前 面 所 有 博弈 的 结果 。 这 里 分 析 的 中 心 问 题 是 〈 可 信 的 ) 威胁 和 对 以 后 
行为 所 考 的 际 诺 可 以 影响 到 当前 的 行为 。 我 们 给 出 重复 博弈 中 子 博 弈 精炼 
纳什 均衡 的 定义 ， 并 将 其 与 第 2.1 节 中 的 道 向 归纳 和 解 和 第 2.2 节 中 子 博弈 
精炼 解 联系 起 来 ， 还 将 给 出 无 限 次 重复 博 弃 中 的 无 名 氏 定 理 (Folk Theo- 
rem) REHE., ERAS, Ha BES (1971) 的 古 庶 双 头 区 
Biwi eR, RES MRA AK (Shapiro & Stiglitz, 1984) 

的 货币 政策 模型 。 
| 第 2.4 节 我 们 介绍 分 析 一 般 的 完全 信息 动态 博弈 所 需要 的 工具 ， 不 再 
区 分 信息 是 次 是 完美 的 。 我 们 定义 博弈 的 扩展 式 表 述 并 将 其 与 第 一 章 介 绍 
的 标准 式 表 述 相互 联系 起 来 ,同时 定义 一 般 博弈 中 的 子 博弈 精炼 纳什 均衡 。 
本 节 和 本章 的 重点 都 在 于 ,一 个 完全 信息 动态 博 弃 可 能 会 有 多 个 纳什 均衡 ， 
得 其 中 一 些 均衡 也 许 包 含 了 不 可 置信 的 威胁 或 承诺 , RE A AT A 
则 是 通过 了 可 信 性 检验 的 均衡 。 


2.1 完全 上 且 完美 信息 动态 博 弃 


2.1.A ”理论 ;逆向 归纳 法 


手雷 博弈 属于 下 面 简单 类 型 的 完全 且 完 美 信息 动态 博弈 ; 

1. 参与 者 1 从 可 行 集 A, 中 选择 一 个 行动 ags 

2. 参与 者 2 观察 到 a1, 之 后 从 可 行 集 A 中 选择 一 个 行动 a2, 
3. 页 人 的 收益 分 别 为 ay ( a1, a2) 和 w2( a1, 22) 0 
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许多 经 济 问题 都 符合 这 种 博弈 ,2 其 中 的 两 个 例子 (后 面 将 进行 详细 
讨论 ) 是 斯 塔 克 尔 贝 里 的 双 头 垄断 模型 和 里 昂 葛 夫 的 有 工会 企业 工资 和 就 业 
模型 。 其 他 的 经 济 问 题 可 通过 允许 更 长 的 行动 序列 建立 模型 :或 者 加 入 更 多 
的 参与 者 ,或 者 允许 参与 者 有 多 步行 动 ( 在 第 2.1.1 节 讨 论 的 鲁 宾 斯 坦 的 讨 
价 还 价 模型 就 是 后 者 的 一 个 例子 )。 完 全 县 完美 信息 动态 博弈 的 主要 特点 
是 :(D 行 动 是 顺序 发 生 的 , (i) 下 一 步行 动 选择 之 前 ,所 有 以 前 的 行动 都 可 
被 观察 到 , 及 (iii) 每 一 可 能 的 行动 组 合 下 参与 者 的 收 兽 都 是 共同 知识 。 

我 们 可 以 通过 逆向 归纳 法 求解 此 类 博弈 问题 ,方法 如 下 。 当 在 博弈 的 
第 二 阶段 参与 者 2 行动 时 , 由 于 其 前 参与 者 1 CART a, 他 面临 的 决 
策 问 题 可 用 下 式 表示 : 


max tl adj, & = 
2€ Ay 2f I> 2) 


假定 对 A, 中 的 每 一 个 el 参与 者 2 的 最 优化 问题 只 有 惟一 解 , H R 
(a) RR, 这 就 是 参与 者 2 对 参与 者 1 的 行动 的 反应 (或 最 优 反 应 )。 由 于 
参与 者 1 能 够 和 人 参与 者 2 一 样 解 出 2 的 问题 ,参与 者 1 可 以 预测 到 参与 者 2 
对 1 每 一 个 可 能 的 行动 a, 所 作出 的 反应 , 这样 1 在 第 一 舱 段 要 解决 的 问题 
可 归结 为 : 


max #1(a1,R2€a1)) * 


假定 参与 者 1 的 这 一 最 优化 问题 同样 有 惟一 解 , 表示 为 ai, ROS 
(Ca? ;Ra(af )) 是 这 一 博弈 的 逆向 归纳 解 。 逆 向 归纳 和 解 不 含有 不 可 置信 的 
威胁 :参与 者 1 预测 参与 者 2 将 对 1 可 能 选择 的 任何 行动 a, 做 出 最 优 反 
应 ,选择 行动 Ra(al); 这 一 预测 排除 了 参与 者 2 不 可 置信 的 威胁 , 即 参 与 者 
2 将 在 第 二 阶段 到 来 时 散 出 不 符合 自身 利益 的 反应 。 

在 第 一 章 中 我 们 用 标准 式 表 述 研 究 完 全 信息 静态 博弈 , 并 作为 这 种 博 
弈 的 解 的 概念 ,重点 讨论 了 纳什 均衡 。 不 过 在 本 节 对 动态 博弈 的 讨论 中 , 我 
们 苞 不 涉及 标准 式 表 述 , 亦 不 棍 及 纳什 均衡 ;分 别 伐 之 以 (1 一 (3) 中 对 博弈 
的 文字 描述 和 已 定义 的 道 向 归纳 解 。 在 第 2.4.A 节 中 , 为 了 使 概念 更 精 
m, 我 们 将 定义 于 和 情 弈 精炼 纳什 均衡 为 ;只 有 不 包含 不 可 置信 的 威胁 的 纳什 
均衡 才 是 子 博 弈 精炼 纳什 均衡 ,我 们 会 发 现 一 个 属于 (1) 一 (3) 所 界定 的 博 


D 大 与 者 2 的 可 选择 行动 空间 AL 可 以 允许 核 赖 于 参与 者 1 的 行动 et。 这 种 依赖 性 可 以 表 
示 为 Ala 或 者 可 以 合并 到 参与 者 ? 的 收益 函数 中 , 对 那些 给 定 a 时 不 可 行 的 ez, > ulap 
a2)= - oo。 有 时 参与 者 1 的 某 些 行 动 甚至 可 以 结束 整个 博 穿 , 不 给 参与 者 2 行动 的 机 会 ,对 这 样 
的 a, A. 可行 的 行动 空间 A2ta1) 中 只 有 一 个 元 素 , CBS 2 别 无 选择 。 
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FAS ASPB, AEH FERRARA THORS Sw 
PAA. TERRES 1.1.C 节 中 所 观察 到 的 , Gee As 
个 纳什 均衡 , 但 有 一 个 均衡 明显 占 优 ,成 为 博弈 的 解 。 

本 节 的 最 后 , 我们 探讨 逆向 归纳 法 背后 的 理性 假定 。 考 虚 下 面 的 三 步 
博弈 ,其 中 参与 者 1 有 两 次 行动 ， 

1. 参与 者 1 选择 工 RR, RPL 使 博 蛮 结束 ,参与 者 1 的 收益 为 2, 参 
与 者 2 的 收益 为 0; . 

2. 参与 者 2 观测 参与 者 1 的 选择 , 如果 1 选择 民 , 则 2 AEL RRR’, 
其 中 工 ' 使 博弈 结束 ,两 人 的 收益 均 为 1; 

3. 参与 者 1 观测 2 的 选择 (并 且 回 忆 在 第 一 阶段 时 自己 的 选择 )。 如 
果 前 两 阶段 的 选择 分 别 为 丸和 民 , 测 1 可 选择 天 或 本, 每 一 选择 都 将 结 
RBA. 六 时 参与 者 工 的 收益 为 3，2 的 收益 为 0 如 选 尺 ,两 人 的 收益 分 别 
为 0 和 2。 

上 面 的 语言 描述 可 以 用 如 下 简明 的 博弈 树 表示 (这 是 博弈 的 扩展 式 表 
述 ,我们 将 在 第 2.4 节 进 行 更 一 般 的 讨论 )。 伟 弈 树 上 每 一 枝 的 末端 都 有 两 
个 收益 值 , 上面 代 表 参 与 者 1 的 收益 ,下 面 代 表 参 与 者 2 的 收益 。 


为 计算 出 这 一 博弈 的 道 向 归纳 解 ,我们 从 第 三 阶 朋 ( 即 参 与 者 1 的 第 二 
次 行动 } 开 始 。 这 里 参与 者 1 面临 的 选择 是 ;L” 可 得 收益 3，R" 可 得 收益 0， 
于 是 工 * 是 最 优 的 。 那 么 在 第 二 阶段 ,参与 者 2 预测 到 一 旦 博弈 进入 到 第 三 
ME, 则 参与 者 1 会 选择 ,这 会 使 2 的 收益 为 0, 从 丽 参 与 者 2 在 第 二 阶段 
的 选择 为 :上 可 得 收益 1, ROO SK 0, 于 是 工 是 最 优 的 。 这 样 , 在 第 一 
阶段 , 参与 者 1 预测 到 如 果 博 弈 进入 到 第 二 阶段 ,2 将 选择 L', 使 参与 者 1 
的 收益 为 1, 从 而 参与 者 1 在 第 一 阶段 的 选择 是 : 工 RA 2,R KRAL, 
于 是 工 是 最 优 的 。 
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上 述 过 程 求 出 博弈 的 道 向 归纳 解 为 ,参与 者 1 在 第 一 阶段 选择 工 , 从 而 
使 博弈 结束 。 即 使 逆向 归纳 预测 博弈 将 在 第 一 阶段 结束 , 但 论证 过 程 的 重 
要 部 分 却 是 考虑 如 果 博 穿 不 在 第 一 阶段 结束 时 可 能 发 生 的 情况 。 比 如 在 第 
二 阶段 , 当 参 与 者 2 预测 如 果 博 弈 进入 第 三 阶段 , 则 1 会 选择 L, 这 时 2 假 
定 1 是 理性 的 。 由 于 只 有 在 1 偏离 了 博弈 的 逆向 归纳 解 , 才能 轮 得 到 2 KE 
择 行动 , 而 这 时 2 对 1 的 理性 假定 便 看 似 是 巴 盾 的 , 即 如 果 1 在 第 一 阶段 选 
ET 尺 , 那 么 第 二 阶段 2 就 不 能 再 假定 1 是 理性 的 了 。 但 这 种 理解 是 不 对 
的 ;如 果 1 在 第 一 阶段 选择 了 RR, 则 两 个 参与 者 都 是 理性 的 就 不 可 能 是 共同 
知识 ,但 这 时 1 仍 有 理由 在 第 一 阶段 选择 RR, 却 不 与 2 对 1 的 理性 假定 相 牙 
盾 。? 一 种 可 能 是 “参与 者 1 是 理性 的 "是 共同 知识 , 但 “参与 者 2 是 理性 
的 " 却 不 是 共同 知识 :如 果 1 认为 2 可 能 不 是 理性 的 , 则 1 就 可 能 在 第 一 阶 
段 选择 及 ,希望 2 在 第 二 阶段 选择 R, 从 而 给 1 以 机 会 在 第 三 阶段 选择 
L”。 另 一 种 可 能 是 “参与 者 2 BREN BEA MIA, SSA 1 是 理性 
的 " 却 不 是 共同 知识 :如果 1 是 理性 的 ,但 推测 2 可 能 认为 1 是 非 理性 的 ,这 
时 1 也 可 能 在 第 一 阶段 选择 民 , 希 望 2 会 认为 1 是 非 理性 的 而 在 第 二 阶段 
选择 R, 1 能 在 第 三 阶段 选择 R*"。 首 向 归纳 中 关于 1 在 第 一 阶段 选 
择 R 的 假定 可 通过 上 面 的 情况 得 到 解释 。 不 过 在 有 些 博弈 中 ,对 1 选择 了 
R 的 更 为 合理 的 假定 是 1 确实 是 非 理 性 的 。 在 这 样 的 博 许 中 , 逆向 归纳 在 
预测 博弈 进行 方面 就 会 失去 其 大 部 分 作用 , 正 像 在 博弈 论 不 能 提供 惟一 解 
并 不 能 达成 协 设 的 博弈 中 , 纳什 均衡 也 对 预测 博弈 的 结果 所 助 无 几 。 


2.1.8 斯 塔 克 尔 贝 里 双关 天 新 模型 


斯 塔 克 尔 贝 里 (1934) 提 出 一 个 双 头 垄断 的 动态 模型 , 其 中 一 个 支配 企 
业 ( 领 导 者 ) 首 先行 动 , 然后 从 属 企业 (起 随 者 ) 行 动 。 上 比如 在 美国 汽车 产业 
发 展 史 中 的 某 些 阶段 , 通用 汽车 就 扮演 过 这 种 领导 者 的 角色 (这 一 例子 把 模 
型 直接 扩展 到 多 许 不 止 一 个 塌 随 企业 , 如 福特 .克莱斯勒 等 等 )。 根 据 斯 塔 
克 尔 贝 里 的 假定 , 模型 中 的 企业 选择 其 产量 .这 一 点 和 古 诺 模 型 是 一 致 的 
《只 不 过 古 诸 横 型 中 企业 是 同时 行动 的 , 不 同 于 这 里 的 序 贯 行动 )。 至 于 在 
类 似 于 贝 特 兰 德 模型 中 企业 (同时 地 ?选择 价格 的 假定 下 , 如 何 构建 相似 的 
序 贯 行动 模型 , 我 们 留 作 习 感 请 读者 自己 练习 。 


© ” 国 想 我 们 在 重复 删除 严格 劣 战略 的 讨论 村 {在 第 1.1. 记 节 ), 豫 与 者 是 理性 的 是 共同 知识 ， 
如 果 所 有 参与 者 都 是 理性 的 , 并 且 所 有 参与 者 都 知道 所 有 参与 者 都 是 理性 的 , 并 且 所 有 参与 者 都 知 
道 所 有 参与 者 都 知道 所 有 参与 者 都 是 理性 的 , 如 此 等 等 , 以 至 无 穷 。 
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博弈 的 时 间 顺 序 如 于 :(1) 企 业 1 选择 产量 g 0; (2) ab 2 观测 到 gi, 

然后 选择 产量 g.>0;(3) 2d = 的 收益 由 下 面 的 利润 函数 给 出 
mlq;,a=a{(Q)-c¢] . 

这 里 p(Q)=a- 眉 , 是 市 场 上 的 总 产品 Q= qg t+ g 时 的 市 场 出 清 价 格 , c 
是 生产 的 边际 成 本 , 为 一 常数 (固定 成 本 为 0)。 

为 解 出 这 一 博弈 的 逆向 归纳 解 , 我 们 首先 计算 企业 2 对 企业 1 任意 产 
量 的 最 优 反 应 , RR,(g1) 应 满足 

max "2 gi» q2} = max qzla - q1- gz- €] ， 
由 上 式 可 得 | 
Raq) = + 


已 知 91<a 一 c, 在 第 1.2.A 节 我 们 分 析 同 时 行动 的 古 庶 博 弈 中 ,得 出 的 R 
(cl) 和 上 式 完 全 一 致 , 两 考 的 不 同 之 处 在 于 这 里 的 民 2t91) 是 企业 2 对 企业 
1 已 观测 到 的 产量 的 真实 反应 ,而 在 古 诺 的 分 析 中 , Rtq1) 是 企业 2 对 假定 
的 企业 1 的 产量 的 最 优 反 应 , HEN 1 的 产量 选择 是 和 企业 2 同时 作出 的 。 

由 于 企业 工 也 能 够 像 企业 2 一 样 解 出 企业 2 的 最 优 反 应 ,企业 1 就 可 
以 预测 到 他 如 选择 gq1, 企业 2 将 根据 Rz(gi) 选 择 的 产量 。 那 么 .在 搏弈 的 
第 一 阶段 ,企业 上 的 问题 就 可 表示 为 


max m (a1, Re(qi)) = max qıla — qı- R2€qi) 一 ec] 


a 
= mak 
9,20 a 


由 上 式 可 得 


2 
a— 


qi 


[a 


fid R2(er d= 4 ’ 
TX BEE HSS Fe OR UE E A ST HE Py a. D 

回顾 在 第 1 章 古 诺 请 弈 的 纳什 均衡 中 , 每 一 企业 的 产量 为 (a -~ 0/3, 
也 就 是 说 ,斯 塔 克 尔 贝 里 博弈 中 逆向 归纳 解 的 总 产量 bCa - c)74, 比 古 诺 博 
弈 中 纳什 均衡 的 总 产量 2{a 一 c)/3 要 高 , 从 而 斯 塔 克 尔 贝 里 博弈 相应 的 市 


中 ”正如 * 古 诺 均 衡 " 和 ” 贝 特 兰 草 均 和 病 " 一 般 是 指 吉 诺 和 贝 特 兰 德 博 蛮 中 的 销 什 均 生 , HO 
塔 克 尔 由 里 均 奖 ” 一 般 表 示 序 芙 行动 博弈 ,用 以 和 国 时 行动 相 区 别 。 但 如 前 一 节 提 到 过 的 , 序 嘻 行 
动 博弈 有 时 会 有 多 个 纳什 均衡 , 共有 一 个 是 和 配 蛮 的 逆向 归纳 解 相关 的 ,这 样 “斯 培 克 尔 贝 里 均 寅 ” 
RATHA X, a EE RTA, 及 用 来 表示 比 笛 单 纳什 均 枉 条 件 更 强 的 解 的 概念 。 
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场 出 清 价 格 就 比较 低 。 不 过 在 斯 塔 克 尔 贝 里 博弈 中 , 企业 1 完全 可 以 选择 
古 诺 均衡 产量 (a - c)73, 这 时 企业 2 的 最 优 反应 同样 是 古 诺 均 衡 的 产量 ， 
也 就 是 说 在 斯 塔 克 尔 山里 博弈 中 , 企业 了 完全 可 以 使 利润 水 平 达 到 十 诺 均 
HEKE, 而 却 选择 了 其 他 产量 , 那么 企业 1 在 斯 塔 克 尔 贝 里 博弈 中 的 利润 
一 定 高 于 其 在 十 诺 博弈 中 的 利润 。 但 斯 塔 克 尔 贝 里 博弈 中 的 市 场 出 清 价 格 
降低 了 ,从 而 总 利 将 水 平 也 会 和 下降, 那么 和 古 诺 博弈 的 结果 相 比 ,在 斯 塔 克 
尔 贝 里 博弈 中 , 企业 1 利润 的 增加 必定 意味 着 企业 2 福利 的 恶化 。 

Ph EEA E, rd Se AR OL SE Pb 2 利润 水 平 的 降低 , 揭示 了 
单 人 决 第 问题 和 客人 决策 问题 的 一 个 重要 不 同 之 处 。 在 单 人 决策 理论 中 ， 
占有 更 多 的 信息 决 不 会 对 决策 制定 者 带 来 不 利 , 然而 在 博弈 论 中 , TEES 
的 信息 (或 更 为 精确 地 说 .是 让 其 他 参加 者 知道 一 个 人 掌握 更 多 的 信息 )? 却 
可 以 让 一 个 参与 者 受 损 。 

在 斯 塔 克 尔 负 里 博弈 中 , 存在 和 癌 题 的 信息 是 企业 的 产量 :企业 2 知道 g, 
并 且 ( 重 要 的 是 ) 企 业 1 知道 企业 2 知道 9i。 为 看 清楚 这 一 信息 的 影响 , 我 们 
把 上 面 序 贯 行动 的 博弈 稍 作 修改 , 假设 企业 1 先 选择 qj, 之 后 企业 2 选择 gp, 
但 事前 并 没有 观测 到 gl。 如 果 企 业 2 确信 企业 1 选择 了 它 的 斯 塔 克 尔 贝 里 
产量 gr = (a 一 c)/2, 则 企业 2 的 最 优 反 应 仍 是 RZ lgi }= ta 一 c)/4。 但 是 ， 
如 果 企 业 1 预测 到 企业 2 将 持 有 这 一 推断 并 选择 这 一 产量 , 企业 1 就 会 从 向 
FEX a -cj74 的 最 优 反 应 一 一 有 妈 3(a — cj)73 一 一 而 不 愿 去 选择 斯 塔 克 尔 
由 里 产量 (a - ec)72, 那 么 企业 2 就 不 会 相信 企业 1 选择 了 斯 塔 克 尔 贝 里 产 
量 。 从 而 这 一 修改 过 的 序 贯 行动 博弈 的 惟一 纳什 震 衡 , 对 两 个 企业 都 是 选择 
产量 (a - <)73 一 一 -这 正 是 古 诺 博弈 中 的 纳什 均衡 ,其 中 企业 是 同时 行动 的 。p 
亦 即 ,使 企业 1 知道 ,企业 2 知道 g 给 企业 2 带 来 了 损失 。 


2.1.C 有 工会 企业 的 工资 和 就 业 


在 里 昂 惕 夫 (1946) 模 型 中 ,讨论 了 一 个 企业 和 一 个 垄断 的 工会 组 织 ( 即 
作为 企业 劳动 力 惟一 供给 者 的 工会 组 织 ) 的 相互 关系 :工会 对 工资 水 平 说 一 
不 二 ,但 企业 却 可 以 自主 决定 就 业 人 数 (《 在 更 符合 现实 情况 的 模型 中 , 企业 
和 工会 间 就 工资 水 平 讨价还价 , 但 企业 仍 自 主 决 定 就 业 , 得 到 的 定性 结果 与 
本 模型 相似 )。 工 会 的 效用 通 数 为 U(w, 工 ), 其 中 w 为 工会 向 企业 开 出 的 


D 此 人 鲁 也 说 明了 ,我 们 在 第 1.1.A 节 中 作出 的 一 个 结论 :在 标准 式 博 许 中 , 参与 者 同时 渤 择 
A BHRR, 但 这 并 不 可 求 各 方 有 必须 同 时 行动 ! 只 要 每 个 人 在 选择 自己 的 行动 时 不 知道 其 他 人 的 选 
择 就 足够 了 。 关 于 这 一 点 的 进一步 讨论 参见 第 2.4.A 节 。 
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工资 水 平 ,上 为 就 业 人 数 。 假 定 Uw, LD w ML 的 增 函 数 。 企 业 的 利 
WARO ale, LI=ROLI- wL, AP ROA CIE L 名 工人 人 可 以 取 
‘BAYA ERRA EPA Pa TRS OP), 假定 REMAN, 并 且 为 
pm BY (concave). 

fe BRA A. 1) Lee ih SEM COKE ww;(2) 企 业 观 测 到 
(并 接受 }w, EAR LORDA Uw, LIM riw, Lo 
即使 没有 假定 Ulw, LOM R(L) 的 具体 的 表达 式 , 从 而 无 法 明确 解 出 该 博 
弈 的 道 向 归纳 解 , 但 我 们 仍 可 以 就 解 的 主要 特征 进行 讨论 。 

首先 , 对 工会 在 第 一 阶段 任意 一 个 工资 本 平 w, 我 们 能 够 分 析 在 第 二 
RWB Le RE, Soe w, 企业 选择 L "(rw) 满 足下 式 : 


maxx(w, L} = maxR(L)- wL , 
Leo Len 
一 阶 条 件 为 
R’(L)-w=0. 
为 保证 一 阶 条 件 R'CL) 一 w=0 有 和 解 ,假定 R’(O) = ©, H R’(o) =0, H 
E 2.1.1 所 示 。 
HE =e 


R(L) 


L* tw) 


图 2.1.1 


图 2.1.2 把 L* (ww) 表 示 为 ww 的 函数 (但 谷 标 轴 经 过 旋转 , 以 便于 和 以 
后 的 数据 相 比 较 ), 并 表示 出 它 和 企业 每 条 等 利润 线 交 于 其 最 高 点 。 了 BS 


OD 后面 一 点 只 不 过 是 L" Ge) se MB aR, PP SE w, be ae, DK 
i. Wma w, 则 企业 沿 w = w 的 水 平 线 选择 上 ,而 企业 选择 的 就 业 工 能 使 可 能 的 利润 达 
到 最 高 , 礁 而 使 通过 (LL, w )} 的 等 利润 曲线 与 约束 we = w Ae 
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L 保持 不 变 , w 降低 时 企业 的 利润 就 会 提高 , 于 是 较 低 的 等 利润 曲线 代表 
了 较 高 的 利润 水 平 。 图 2.1.3 描述 了 工会 的 无 差异 曲线 ,车 令 工 不 变 , 当 


w 提高 时 工会 的 福利 就 会 增加 ,于 是 较 高 的 无 差异 曲线 代表 了 工会 较 高 的 
效用 水 平 。 


L* @w*) 


企业 的 等 利润 曲线 


图 2.1.2 


We 


工会 的 无 差异 曲线 


2.1.3 


下 面 我 们 分 析 工 会 在 第 一 阶段 的 问题 ,由 于 工会 和 企业 同样 可 以 解 出 
企业 在 第 二 阶段 的 问题 , 工会 就 可 预测 到 如 果 它 要 求 的 工资 水 平 为 四， 企 
业 最 优 反 应 的 就 业 人 数 将 会 是 工 * (mi)。 那 么 ,工会 在 第 一 阶段 的 问题 可 
以 表示 为 ; 

maxUCw, LL Cw)) . 
表现 在 图 2.1.3 的 无 差异 曲线 上 就 是 ,工会 希望 选择 一 个 工资 水 平 


$2 jee Ry 


w, 由 此 得 到 的 结果 (ww, "(xw)) 处 于 可 能 达到 的 最 高 的 无 差异 线 上 。 这 
一 最 优化 问题 的 解 为 w" , 这样 一 个 工 砍 要 求 将 使 得 工会 通过 (w“, 工 ” 
(w* )) 的 无 差异 曲线 与 上“"(w) 相 切 于 该 点 , 如 图 2.1.4 所 示 。 从 而 ， 
CWE * Cw” 就 是 这 一 工资 与 就 业 博弈 的 道 向 归纳 解 。 


工会 的 无 差异 曲线 


L* iw) 


E*(w*) L 


图 2.1.4 


更 进一步 我 们 还 可 以 看 出 ,(w",L“ (rw “)) 是 低 效率 的 , 在 图 2.1.5 
中 , 如果 ww AL 处 于 图 中 阴影 部 分 以 内 , 企业 和 工会 的 效用 水 平 都 会 提高 。 
这 种 低 效 率 对 实践 中 企业 对 和 雇 傅 工人 数量 保持 的 绝对 控制 权 提 出 了 质疑 。 
(允许 工人 和 企业 就 工资 相互 讨价还价 ,但 企业 仍 对 雇佣 工人 数量 绝对 控 
市 , 也 会 得 到 相似 的 低 效率 解 )。 t Ri E R BEM E (Espinosa & Rhee, 1989) 
基于 如 下 事实 为 这 一 质疑 提供 了 一 个 解释 :企业 和 工会 之 间 经 常会 进行 定 
期 或 不 定期 的 重复 谈判 (在 美国 经 常 是 每 三 年 一 次 ), 在 这 样 的 重复 博弈 中 ， 
研 能 会 存在 一 个 均衡 ,使 得 工会 的 选择 w 和 企业 的 选择 三 都 在 图 2.1,5 所 
示 的 阴影 部 分 以 内 ,即使 在 每 一 次 性 谈判 中 ,这样 的 w 和 上 APIA 
纳 解 。 参 见 第 2.3 PPKFRSRRHMH, 以 及 习题 2.16 CRE 
和 里 模型 的 分 析 。 


2.1.D 序 贯 谈判 


我 们 首先 分 析 一 个 三 阶 谈 头 模型 , 它 属 于 第 2.1.A 节 分 析 过 的 博弈 模 
型 ,然后 我 们 讨论 鲁 宾 斯 坦 (1982) 模 型 ,其 中 博弈 的 { 洪 在 ) 阶 段 数 是 无 限 
的 。 在 所 有 了 两 个 模型 中 ,都 可 马上 得 到 谈判 结果 不 可 能 发 生 持久 的 谈 
HGW) JEER, ER HRAM Sobel & Takahashi 1983) 关 于 非 
Pris BP AS PRR A eS, 罢工 的 发 生 以 正 福 率 存 在 于 惟一 的 ( 精 卉 中 
叶 斯 均衡 之 中 ,参见 第 4.3. 孔 节 。 
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wth 企业 的 等 利 调 曲 线 


L* dw) 
L*(w*) 
图 2.1.5 


参与 人 1 和 2 就 一 美元 的 分 配 进 行 谈判 。 他 们 轮流 提出 方案 :首先 参 
与 人 1 提出 一 个 分 配 建 说 ,参与 人 2 可 以 接受 或 拒绝 ;如 果 和 参与 人 2 拒绝 ， 
就 由 参与 人 2 提出 分 配 建议 , 参与 人 1 选择 接受 或 拒绝 ;如 此 一 直 进 行 下 
去 。 一 个 条 件 一 旦 被 拒绝 , 它 就 不 再 有 任何 约束 力 ,并 和 博弈 下 面 的 进行 不 
再 相关 。 每 一 个 条 件 都 代表 一 个 阶段 ,参与 人 都 没有 足 驶 的 耐心 ;他 们 对 后 
面 阶段 得 到 的 收益 进行 贴现 , 每 一 阶段 的 贴现 因子 为 85, 这 里 0<8<1。 了 

下 面 是 对 三 阶段 谈判 博弈 时 序 的 更 为 详细 的 描述 

(1a) 在 第 一 阶段 开始 时 ,参与 人 1 建议 他 分 走 1 美元 的 s1, 留 给 参与 人 
2 的 份额 为 1 一; 

(1b) 参 与 人 2 或 者 接受 这 一 条 件 ( 这 种 情况 下 ,博弈 结束 , 参与 人 1 的 
收益 为 s1, 参与 人 2 的 收益 为 1 - 5), 都 可 立刻 拿 到 ), 或 者 拒绝 这 一 条 件 
(这 种 情况 下 , 博弈 将 继续 进行 ,进入 第 二 阶段 ); 

(2a) 在 第 二 阶段 的 开始 , 参与 人 2 提议 参与 人 1 分 得 1 美元 的 s, BS 
参与 人 2 的 份额 为 1- s1( 请 注意 在 阶段 :+, s 总 是 表示 分 给 参与 人 1 的 ,而 
不 论 是 谁 先 提 出 的 条 件 ); 

(2b) 参 与 人 1 或 者 接受 条 件 (这 种 情况 下 , 博弈 结束 , 参与 人 1 的 收益 
so 和 参与 人 二 的 收益 1 - sp 都 可 立即 拿 到 ), 或 者 拒绝 这 一 条 件 (这 种 情况 
下 ,博弈 继续 进行 , 进入 第 三 阶段 ) 

(3) 在 第 三 阶段 的 开始 , 参与 人 1 得 到 1 美元 的 ;, 参与 人 2 得 到 1 一 ;， 


OD ”贴现 因子 3 反 上 晓 了 党 币 的 时 间 信 值 。 在 一 个 前 盘 开 始 时 取得 的 一 美元 可 以 存 和 银行, 赚 
RAB, 比如 说 每 期 利息 为 +, 则 在 下 一 阶段 开始 时 的 价值 就 成 为 1+r 美元 。 同样, 下 一 阶段 开始 
时 要 得 到 的 一 美元 , 现在 的 价值 只 有 17(1+ 7) 问 元 。 令 85=1A(1+ 7), 则 下 一 阶段 可 得 到 的 收益 x 
RERA #x, 距 现在 两 个 阶 眉 之 后 得 到 的 收益 = 现 值 只 有 #?x, 如 此 等 等 。 来 来 收益 今天 的 价值 称 
为 这 一 收益 的 现 慎 。 


54 PRIS BERT 


这 里 0<s<1。 

在 这 样 的 三 阶段 博弈 中 , 第 三 阶段 的 解决 方案 (s,1- *) 是 外 生 给 定 的 。 
在 我 们 后 面 将 考虑 的 无 限期 模型 中 , 第 三 阶段 的 收益 s 将 表示 如 果 请 弈 进 
行 到 第 三 阶段 ( 即 如 果 前 面 两 个 提议 都 被 拒绝 ) 的 话 , 参与 人 1 在 其 后 进行 
的 博弈 中 可 得 到 的 收益 。 

为 解 出 此 三 阶段 博弈 的 北向 归纳 解 , 首先 需要 计算 如 果 博 弈 进行 到 第 
二 阶段 ,参与 人 2 可 能 提出 的 最 优 条 件 。 参 与 人 1 拒绝 参与 人 2 在 这 一 阶 
RA so, 可 以 在 第 三 阶段 得 到 ;, 但 下 一 阶段 的 ;在 当期 的 价值 只 有 
s BBA, 当 且 位 当 sects, 参与 人 1 才 会 接受 sf 我 们 假定 当 接 受 和 拒绝 
并 无 差异 时 ,参与 人 总 是 选择 接受 条 件 )。 从 而 参与 人 2 在 第 二 阶段 的 决策 
问题 就 可 归于 在 本 阶段 收入 1 -5.s{ 道 过 向 参与 人 1 提出 条 件 , 给 他 ya = 
8-…s) 和 下 阶段 收入 1 一 s( 通 过 向 参与 人 1 提出 条 件 , 给 他 任意 的 5s. < 8-5) 
之 闻 作 出 选择 。 后 一 选择 的 贴现 秆 为 $,(1 一 s), 小 于 前 一 选择 可 得 的 1- 
6°s, 于 是 参与 人 2 在 第 二 阶段 可 以 提出 的 最 优 条 件 是 sf = 8's。 也 就 是 
说 , MRSA MTA HMR 参与 人 2 和 将 提出 条 件 * ,参与 人 1 选择 接受 
条 件 。 

由 于 参与 人 1 可 以 和 参与 人 2 同样 地 解 出 参与 人 2 在 第 二 阶段 的 决策 
问题 , 参与 人 1 也 就 知道 参与 人 2 通过 拒绝 参与 人 1 的 条 件 ,在 第 二 阶段 可 
以 得 到 1- sz ,但 下 一 阶段 得 到 的 1 -s 在 本 阶段 的 价值 只 有 5:(1 一 
sp Jo PBA, 5AN 1-si- sN sy Sl — 8-1 -— sy ) 时 ,参与 人 人 
2 才 会 接受 1- st。 从 而 参与 人 1 在 第 一 阶段 的 决策 问题 就 可 归于 在 本 阶 
Buk A 1-8 (1-3 CHR BA A 2 EHR- s= -DAF 
阶段 收入 sf (通过 向 参与 人 2 提出 出 任意 移 1 一 sj < 8-1 -sz )) 之 间作 出 
选择 。 后 一 选择 的 贴现 值 为 8 = 2…, 小 于 前 一 选择 可 得 的 1 一 8: (1 一 
sp) =1-801-6-s), TESSA 1 在 第 一 阶段 提出 的 最 优 条 人 忻 是 sy =1 

é-(1-s7)=1-é(1-6-s). 这样 ,在 此 三 阶段 博弈 的 逆向 归纳 解 中， 
参与 人 1 向 参与 人 2 提出 分 配方 案 (s? ,1 一 了), 后 者 接受 该 方案 。 

现在 考 虚 元 限期 的 情况 。 博 弈 时 序 和 前 面 的 描述 完全 一 致 , 只 是 第 (3) 
阶段 第 出 的 外 生 和 解决 方案 被 其 后 的 无 限 步 讨价还价 (3a)、(3b)》、(4a)、(4b) 
等 等 所 代替 ;奇数 步 由 参与 人 1 出 条 件 , 偶数 步 由 参与 人 2 出 条 件 ,直至 一 
方 接受 条 件 , 讨价还价 结束 。 和 前 面 分 析 这 的 所 有 应 用 一 样 , 我 们 希望 能 够 
内 后 向 前 推出 这 一 无 限 步 捕 旗 的 道 向 归纳 解 。 担 是 , 由 于 博弈 可 能 会 无 限 
地 进行 下 去 ,因此 并 不 存在 我 们 借以 入 手 分 析 的 最 后 一 步行 动 。 幸 而 下 面 
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fy eS FE Oe EE  ( Shaked & Sutton, 1984) 所 运用 ), (BRAT BY LA 
把 无 限 博 弈 截 开 , HARYA BE ETT OT :从 第 三 阶段 开始 
的 博弈 (如 果 能 进行 到 这 一 阶段 ) 与 (从 第 一 阶段 开始 的 ) 整 个 过 程 的 博弈 是 
相同 的 一 一 两 种 情况 下 ,都 是 由 参与 人 1 首先 提出 条 件 , 其 后 两 个 参与 人 轮 
流出 价 , 直至 有 一 方 接受 条 件 谈判 结束 。 

由 于 尚未 正式 定义 此 类 无 限 博弈 的 逆向 归纳 解 我 们 的 讨论 地 将 是 非 
正式 的 (但 也 可 以 进行 正式 讨论 )。 假 设 完整 过 程 的 博弈 存在 道 向 归纳 解 ， 
此 时 参与 人 1 和 2 务 别 得 到 * 和 1-s。 我 们 可 以 把 这 个 结果 用 于 从 第 三 
院 段 开始 的 博弈 , 如 果 博 弈 进行 到 第 三 阶 县 的 话 ,然后 道 向 推 至 第 一 阶段 
{过 程 与 三 阶段 博弈 中 相同 ), 可 计算 出 整个 博弈 的 新 的 道 向 归纳 解 。 在 这 
一 新 的 逆向 归纳 解 中 , 参与 人 1 将 在 第 一 阶段 提出 解决 方案 (f(s),1 一 了/ 
(5)), 参与 人 2 会 接受 这 一 方案 。 这 里 的 f(s)}=1- 8(1-$'5), 就 是 上 面 
讨论 过 的 ,在 第 三 阶段 解决 方案 (s,1- ;5) 外 生 给 定 条件 下 , 参与 人 1 第 一 阶 
自得 到 的 份额 。 

令 sp 为 参与 人 1 工 在 全 过 程 博弈 中 可 能 得 到 的 道 向 归纳 解 下 的 最 高 收 
益 。 设 想 sp 为 参与 人 1 BIH RAK te, 则 如 前 所 述 ,这 将 产生 一 个 新 的 
逆向 归纳 解 ,其 中 参与 人 1 第 一 阶段 的 收益 为 Flsa)。 由 于 Ps)=1 一 全 + 
67s 是 * 的 增 函 数 , sn 是 第 三 阶段 可 能 达到 的 最 高 收益 , f(sp) 也 就 是 第 一 
阶段 可 能 达到 的 最 高 收益 。 但 同时 ss 又 是 第 一 阶段 可 能 达到 的 最 高 收益 ， 
于 是 有 flsy)= sn。 相似 的 论证 可 证 明 f(si)= ss, 这 里 的 为 参与 人 1 
在 全 过 程 博 弈 中 可 能 得 到 的 逆向 归纳 解 下 的 最 低 收 益 。 满 足 f(s)}=s 的 
惟一 的 * 941/114 6), 我 们 用 s* 表示。 那么 sy = sL =s", 于 是 整个 过 程 
博弈 有 窗 一 的 逆向 归纳 解 :在 第 一 阶段 , 参与 人 1 向 参与 人 2 提出 分 配方 案 

"=1/(1+68),1-s*=6/(1+ 人 5)), 后 者 接受 该 方案 。 


2.2 完全 非 完美 信 息 两 阶段 博 弃 


2.2.4 理论 : 子 博弈 精炼 


现在 我 们 对 前 一 节 所 讨论 的 博弈 类 型 加 以 丰富 。 和 在 完全 且 完 美 信息 
动态 博弈 中 相同 , 我 们 继续 假定 博弈 的 进行 分 为 一 系列 的 阶段 ,下 一 阶段 开 
始 前 参与 者 可 观察 到 前 面 所 有 阶段 的 行动 。 与 上 节 分 析 的 不 同 之 处 在 于 ， 
本 节 我 们 每 一 阶段 中 存在 着 同时 行动 。 在 第 2.4 节 更 进一步 的 分 析 中 我 们 
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HEA, i PP BRA AS 1 eR A Ho HRS T AERA. 
SRT , HS ee An BT — TIE ee A BR SHE. 

FET TEA PS A SE, 并 { 多 人 么 缺乏 创意 地 ) 称 其 为 完全 非 
完美 信息 两 阶段 博弈 : 

1. 参与 者 1 各 2 同时 从 各 自 的 可 行 集 Ay Ay 中 选择 行动 a 和 a2, 

2, 参与 者 3 和 4 观察 到 第 一 阶段 的 结果 , (ai, a2), 然后 同时 从 各 自 的 

可 行 集 A, A, 中 选择 行动 a3 和 aa, 

3. 收益 为 u:€ay,a3,43,44), 1 二 1,2,3,4。 

许多 经 济 学 问题 都 符合 以 上 的 特点 ,人 其 中 三 个 例子 (后 面 进行 详细 
讨论 } 包 括 对 银行 的 挤 提 、 关 税 和 国际 市 场 的 不 完全 竞争 以 及 工作 竞赛 (如 
一 个 企业 中 , 几 个 副 总 裁 为 下 一 任 总 裁 而 竞争 )。 还 有 很 多 经 济 问 题 可 通过 
把 以 上 条 件 稍 却 改 动 而 建立 模型 , 比如 增加 参与 者 大 数 或 者 允许 同一 参与 
者 (在 一 个 以 上 的 阶段 ) 多 次 选择 行动 。 也 可 以 允许 少 于 四 个 的 大 与 者 ;在 
一 些 应 用 中 , 参与 者 3 和 4 就 是 参与 者 1 和 2; 还 有 的 则 不 存在 参与 者 2 或 
参与 者 4。 

我 们 解决 此 类 问题 使 用 的 方法 , 仍 沿 用 了 逆向 归纳 的 思路 ,但 这 里 从 博 
弈 的 最 后 阶段 逆 问 推导 的 第 一 步 就 包含 了 求解 一 个 真正 的 博弈 (给 定 第 一 
阶段 结果 时, 参与 者 3 和 4 在 第 二 阶段 同时 行动 的 博弈 ), 而 不 再 是 前 一 节 
求解 单 人 最 优化 的 决策 疝 题 。 为 使 问题 简化 , 本 节 中 我 们 假设 对 第 一 阶段 
博弈 每 一 个 可 能 结果 {alyaz), 其 后 (参与 者 3 和 4 之 间 的 ) 第 二 阶段 博弈 有 
惟一 的 纳什 均衡 ,表示 为 (aey (a1,22), 423 (a7, 22))。 在 第 2.3.A 节 ( 关 于 
重复 博弈 ?我 们 考虑 放松 这 一 假定 时 的 应 用 。 

如 果 和 参与 人 1 和 2 预测 到 参与 人 3 和 4 在 第 二 阶段 的 行动 将 由 (ca 
(anashai lapa DAMB, 则 参与 人 1 和 2 在 第 一 阶段 的 问题 就 可 用 以 下 
的 同时 行动 博弈 表示 : 

1. 参与 人 1 和 2 同时 从 各 自 的 可 行 集 A, 和 A, 中 选择 行动 a, 和 az; 

2. KEILA ula azyas Cais azhaa Cara2)),， £=1,23 

假定 (ar ,az ) 为 以 上 园 时 行动 博弈 惟一 的 纳什 均衡 ,我 们 称 (ayr ,az ， 
aaryeozeadtor oz 为 这 一 西 阶段 博弈 的 子 博弈 精 堪 解 。 此 解 与 
完全 且 完 美博 弈 中 的 道 向 归纳 解 在 性 质 上 是 一 致 的 , 并 上 且 与 后 者 有 着 类 似 


中 ”和 前 一 节 中 相同 ,参与 者 3 和 4 在 第 二 阶段 的 可 行 集 4 和 A, TARR TAO B 
Rian aa], 在 特定 条 件 下 ,可 以 存在 (fa az) 司 博弈 结束 - 
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的 伏 点 和 不 足 。 如 果 参 与 者 3 和 4 威胁 在 后 面 的 第 二 阶段 博弈 中 , 他们 将 
不 选择 纳什 均衡 下 的 行动 ,参与 人 1 和 2 是 不 会 相信 的 ,因为 当 情 弈 确实 进 
行 到 第 二 阶段 时 , 参与 人 3 和 4 中 至 少 有 一 个 人 不 愿 把 威胁 变 为 现实 { 恰 好 
是 因为 它 不 是 第 二 阶段 博弈 的 纳什 均衡 )。 另 一 方面 ,假设 参与 者 1 就 是 参 
与 者 3, 并 且 参 与 者 1 在 第 一 阶段 并 不 选择 ar ,参与 者 4 就 会 重新 考虑 参 
与 者 3{ 即 参与 者 1) 在 第 二 阶段 将 会 选择 ay (aivaz) 的 假定 。 


2.2.B 对 银行 的 挤 提 


两 个 投资 者 每 人 存 和 人 银行 一 笔 存款 D, 银行 已 将 这 些 存 坎 投 入 一 个 长 
期 项 目 。 如 果 在 该 项 目 到 期 前 银行 被 迫 对 投资 者 变现 , 共 可 收 轩 2r, 这 里 
口 >r>D/2。 不 过 ,如 果 银 行 允 许 投资 项 目 到 期 , 则 项 目 共 可 取得 2R, 这 
BR>D, 

有 两 个 日 期 ,投资 者 可 以 从 银行 提 款 ;日 期 1 在 银行 的 投资 项 目 到 期 之 
前 ,日 期 2 则 在 到 期 之 后 。 为 使 分 析 简 化 , 假设 不 存在 贴现 。 如 果 两 个 投资 
者 都 在 日 期 1 提 款 , 则 每 人 可 得 到 +, 博弈 结束 。 如 果 只 有 一 个 投资 者 在 日 
期 1 提 款 ,他 可 得 到 D, 另 一 人 得 到 2r -也 ,博弈 结 束 。 姻 果 两 人 都 不 在 日 
期 1 提 款 , 风 项 目 铺 束 后 投资 者 在 日 期 2 进行 提 款 决策。 如 时 两 个 投资 者 
都 在 日 期 2 担 款 , 则 每 人 得 到 民 ,博弈 结束 。 如 果 只 有 一 个 投资 者 在 日 期 2 
ER, 则 他 得 到 2R - D, 另 一 人 得 到 D, WFR. BI, 如 果 在 日 期 2 两 
个 投资 者 都 不 提 款 , 则 银行 向 每 个 投资 者 返还 尺 ,博弈 结束 。 

我 们 将 在 第 2.4 节 讨 论 此 类 神 弈 的 正式 表述 方法 ,这 里 只 是 一 般 性 地 
分 析 这 一 癌 题 的 解决 思路 。 两 个 投资 者 在 日 期 1 和 日 期 2 的 收益 情况 ( 作 
为 他 们 在 那 时 提 款 决策 的 函数 ), 可 以 用 下 面 的 两 个 标准 式 博 弈 表示 。 注 意 
这 里 日 期 1 的 标准 式 博弈 是 不 规范 的 :如 果 在 日 期 1 两 个 投资 者 都 选择 不 
ER, 则 没有 与 之 对 应 的 收益 , 这 时 投资 者 要 继续 进行 日 期 2 的 博弈 。 


eK 不 提 提 款 不 提 
nx na| RR [eron] 
不 提 | 2r-D D | 下 一 阶段 | 不 担 | D2R-D| RR | 

日 期 1 日 期 2 


我 们 从 后 往 前 分 析 此 博弈 。 先 考虑 有 日 期 2 的 标准 式 博弈 。 由 于 R>D 
《并 且 由 此 可 得 2R - D> R), “RR PRAT PRK", 那么 这 一 博弈 有 
惟一 的 纳什 均衡 :两 个 投资 者 都 将 提 款 , 最 终 收益 为 (R, R)。 由 于 不 存在 
贴现 , 我 们 可 以 直接 用 这 一 收益 替 入 日 期 1 的 标准 式 博弈 双方 都 不 提 款 时 
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的 情况 ,如 图 2.2.1 所 示 。 由 于 < DOF BAN 2r- D< r), A 
两 阶段 博弈 变形 得 到 的 单 阶段 博弈 存在 两 个 纯 战 略 纳什 均衡 :(1) 两 个 投资 
SMB, 最终 收益 情况 为 (r,r);(2) 两 个 投资 者 都 不 提 孝 ,最 终 收 益 为 
(RR, 尺 )。 从 而 ,最 初 的 两 阶段 银行 挤 提 博弈 就 有 证 个 子 搏弈 精炼 解 (因此 
也 不 完全 符合 第 2.2.A 节 所 定义 的 博弈 类 型 ); (1) 两 个 投资 者 都 在 日 期 
提 款 ,两 人 的 收益 分 别 为 (r,r)if2) 两 个 投资 者 都 不 在 日 期 1 提 款 ,而 在 日 
期 2 提 款 ,两 人 在 日 期 2 的 收益 分 别 为 (R, RR). 


握 教 7B 
ne 


不 提 |2r-D,D| R,R 


Hi 2.2.1 


前 一 种 结果 可 以 解释 为 对 银行 的 一 次 挤 提 。 加 果 投 资 者 1 相信 投资 者 
2 将 在 日 期 1 提 款 , 则 投资 者 1 的 最 优 反 应 也 是 去 提 款 ,即使 他 们 等 到 于 期 
2 再 去 提 款 的 话 两 人 的 福利 都 会 提高 。 这 里 的 银行 撞 提 柚 弈 在 一 个 很 重要 
的 方面 不 同 于 第 1 章 中 讨论 的 囚徒 困境 ;虽然 两 个 博弈 都 存在 一 个 对 整个 
社会 是 低 效 率 的 纳 件 均衡 ;但 在 四 徒 困 境 中 这 一 均衡 是 惟一 的 《并且 是 参与 
者 的 严格 占 优 战略 ), 而 在 这 里 还 同时 存在 另 一 个 有 效率 的 均衡 。 从 而 ,这 
一 模型 并 不 能 预测 何 时 会 发 生 对 银行 的 挤 提 , 但 的 确 显示 出 挤 提 会 作为 一 
个 均衡 结果 而 出 现 。 参 见 戴 蒙 德 和 迪 布 维 格 (1983)? 内 容 更 丰富 的 模型 。 


2.2.C 关税 和 国际 市 场 的 不 完全 竞争 


下 面 我 们 讨论 国际 经 济 学 中 的 一 个 应 用 。 考 虑 两 个 完全 相同 的 国家 。 
分 别 用 i=1,2 表示 。 每 个 国家 有 一 个 政府 负责 确定 关税 税率 ,一 个 企业 制 
造 产品 供给 本 国 的 消费 者 及 出 口 ,和 一 群 消费 者 在 国内 市 场 购买 本 国企 业 
或 外 国企 业 生产 的 产品 。 如 果 { 国 家 i 的 ) 市 场 上 总 产量 为 Qi, 则 市 场 出 清 
价格 为 p;(Q;) =a Qi, 国家 i 中 的 企业 (后 面 称 为 企业 i) 为 国内 市 场 生 
产 h HO i, 则 口 =h;+ ej。 企 业 的 边际 成 本 为 常数 c, 并且 没有 辕 定 
成 本 , 从而, 企业 i 生产 的 总 成 本 为 (hi, ey)=c(hi+ ei), 荔 外 ,产品 出 口 
时 企业 还 要 承担 关税 成 本 ({ 费 用): 如 果 政 府 ; 制定 的 关税 税率 为 /, 企业 i 
向 国家 出 口 e 必须 支付 关税 wje; 给 政府 j。 

博弈 的 时 间 顺 序 如 下 :第 一 , 政府 同时 选择 关税 税率 2, 和 4; 第 二 , 企 
业 观 察 到 关税 税率 , 并 同时 选择 其 提供 国内 消费 和 出 口 的 产量 (41,e1) 和 
(2;e2); 第 三 ,企业 i 的 收益 为 其 利润 额 ,政府 ;的 收益 则 为 本 国 意 的 福 
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利 , 其 中 国家 ; 的 总 福利 是 国家 的 消费 者 享受 的 消费 者 剩余 、? 企业 ; 赚 
取 的 利润 以 及 玻 府 i 从 企业 i 收取 的 关税 收入 之 和 : 
il ty, tjs Risers hys ei) =la Ch; t e)k: tlale + hj) Je, 
— cthjt+e)— tei; 
w¢(tis bys Fis ers hye =ZOQ?t mK ei, tjs Aes eis hj; ej) + fej - 
很 设 政府 已 人选 定 的 税率 分 别 为 如 Me RAS ef Ar, ef ) 为 其 余 
部 分 企业 1 和 企业 2 的 {( 酚 市场) 博弈 的 纳什 均衡 ,对 每 一 个 企业 iA, 
e? ) 必 须 满足 
max xit ti, ts his ets hi se) + 
由 于 Ai Eis fjs Ris Cis h? +e; ) 可 以 表示 为 企业 :在 市 场 i 的 利润 与 在 市 场 j 
的 利润 之 种 , 而 企业 i 往 市 场 i 的 利润 只 是 Me; 的 函数 ,在 市 场 7 的 利 
WAR ehk? 和 4 的 函数 ,企业 ; 在 两 市 场 的 最 优化 问题 就 可 以 简单 地 
拆 分 为 一 对 问题 ,在 每 个 市 场 分 别 求解 :h;) 必须 满足 ， 
maxhila (ht ey ) el , 
He 必须 满足 
maxeila — (er +h; )—e]— te; - 
假设 ef S&a 一 c, 可 得 
hy = 二 (a -ef =c) - (2.2.1) 
同时 假设 AS Sae tj PI 
e = 十 (a 一 A) —e-t;). {2.2.2} 


《从 我 们 求 得 的 结果 来 看 ,和 上 土 面 两 个 假设 是 相符 的 ) 对 每 一 个 i 二 1,2, 都 
必须 同时 满足 (2.2.1) 和 (2.2.2) 现 个 最 代 复 应 函数 ,从 而 我 们 对 四 个 未 知 
数 (h? 了 ,er? kt, ef ) 就 得 到 了 四 个 方程 式 。 但 由 于 这 四 个 方程 可 分 为 两 
组 ,每 两 个 方程 包含 两 个 未 知 数 ,求解 十 分 容易 。 其 解 为 ; 


c+ > a@7~e728; 
hi Ee; = 3 (2.2.3) 


中 如果 消费 者 用 p HTH HEEE r 的 商品 , MIRE SE o- pM. $ 
RAR PQ) =2- O, WR i AEH Pe Q. REANA RA MTERA) 
Qi. 
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比较 第 1.2.A Pa eee, 两 个 企业 选择 的 均衡 产 出 者 是 (fa 一 
c)73, 但 这 一 结果 是 基于 对 称 的 边际 成 本 而 推出 的 。 而 (2.2.3) 式 的 均衡 
结果 与 之 不 同 的 是 ,政府 对 关税 的 选择 使 企业 的 边际 成 本 不 再 对 称 ( 正 如 习 
题 1.6 的 情况 ), 例 如 在 市 场 i 企业 i 的 边际 成 本 是 <, 但 企业 -的 边际 成 
本 则 是 c+ #;。 和 由 于 企业 j RARE, PERM HBR. AR 
企业 > 要 降低 产 出 ,市 场 出 清 价 格 又 会 相应 担 高 ,于 是 企业 i 又 倾向 于 提高 
产 出 ,这 种 情况 下 ,企业 j 的 产量 就 又 会 降低 。 结 果 就 是 在 均 街 条 件 下 ,天 7 
随 z; 的 提高 而 上 升 , e; Bie 的 提高 而 (以 更 快 的 速度 ) 下 降 。 这 一 点 可 以 
从 {2.2.3) 式 的 结果 中 明白 看 出 。 

在 解 出 了 政府 选 定 关税 时 , 其 后 第 二 阶 假 两 企业 博弈 的 结果 之 后 ,我 们 
可 以 把 第 一 防 段 政府 间 的 互动 决策 表示 为 以 下 的 同时 行动 博 讲 :首先 ,政府 
同时 选择 关税 税率 11 和 zz; 第 二 ,政府 1 的 收益 为 Wt. tj, Ader. hi. 
ef ),¢=1,2, RE A? Me? 是 (2.2.3) 式 所 表示 的 n 和 1 He MER 

_ 们 求解 这 一 政府 间 博 弈 的 纳什 均衡 。 

为 简化 使 用 的 表示 符号 , 我们 把 AS RETF ee? HET y ATAF: 
> Wi (ti, 六 ?表示 W(t, bys hiser shz, e2 }, 即 当 政府 i AREH, 
RE j ARER, Ak My 按 (2.2.3) 式 中 的 纳什 均衡 选择 行动 时 政府 : 
的 政 益 。 如 果 (z? , t2 ) 是 这 一 政府 间 捷 弈 的 纳什 均衡 , 则 对 每 一 个 i, e? 
必须 满足 

max Ws Cit, ), 
但 Wi (a, t; RSF 


(2fa 一 cy 一 站 lazct  (a-c—2e/) | (a —¢-2¢,) 
18 + 9 + 9 t 3 , 


于 是 
a-c 
3 

这 一 结果 对 每 一 个 i 都 成 立 , FPR oc, BRE, EA, 选择 
(a - c)/3 的 关税 税率 对 每 个 政府 都 是 占 优 战略 (在 其 他 模型 中 , 比如 当 边 
际 成 本 递增 时 ,政府 的 均衡 战略 就 不 是 占 优 战略 )。 把 避 = 引 = 一 (ac)73 
代入 (2.2.3) 式 可 得 

np = hese H ef =454 
这 就 得 到 企业 第 二 阶段 所 选择 的 产 出 , 至 此 , RIN KSA ERFITT 
FEMI r Het = (a —o)/B,hf =h? =4(a~ ec}/9,e? =e7 =la 


Ld 
ti 一 
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一 c)79)。 

在 子 博弈 精炼 解 中 , 每 一 市 场 上 的 总 产量 为 5(a -ec)79。 进 一 步 分 析 
我 们 会 发 现 , 如果 政府 选择 的 关税 税率 为 0, 则 每 一 市 场 上 的 总 产量 将 为 2 
(a -cc)/3, 等 于 古 诺 模型 的 结果 。 从 而 ,市 场 DARA ELE PLR 
明 , 它 简单 地 等 于 市 场 ; 的 总 产量 平方 的 一 半 ), ERO A RY, 
比 选择 0 BLM BAEK, 事实 上 ,为 0 的 关税 税率 是 社会 最 优选 择 , AW 
t1=t2==0 是 下 式 的 解 

max, Wr Ctt) + Wo Cts, #1) - 


于 是 ， 政府 就 有 动因 签订 一 个 相互 承诺 买 关税 税率 的 协定 ( 即 自 由 贸 
B) CRU BBLS, 即 补贴 , 是 可 行 的 ,社会 最 优化 的 条 件 是 政府 选择 
L=- 一 (a 一 c), 这 使 得 国内 企业 为 本 国 消费 者 提供 的 产 出 为 0, e 
一 国家 出 口 完全 竞争 条 忻 下 的 产量 ) 这 样 , 由 于 企业 i 和 j ROP RE 
《2.2.3) 给 出 的 纳什 均衡 结果 行动 ,政府 在 第 一 阶段 的 互动 决策 就 成 为 囚徒 
国境 式 的 问题 :惟一 的 纳什 均衡 是 其 占 优 战略 , 但 对 整个 社会 却 是 慨 效 率 
的 。 


2.2.D 工作 竞赛 


BARR CHOTA, TCA (RP : BF LR DEE 
出 和 =et+se 其 中 si 是 努力 程度 ,e; 是 随机 扰动 项 。 生产 的 程序 如 下 :第 
一 ,两 个 工人 同时 选择 非 负 的 努力 水 平 e: 兰 0; 第 二 , 随机 扰动 项 sy 和 sz 相 
互 独 立 , 并 服从 期 望 值 为 0. 密度 函数 为 Fe) 的 概率 分 布 ;第 三 ,工人 的 产 
出 可 以 观测 ,但 各 月 选 择 的 努力 水 平 无 法 观测 ,从 而 工人 的 工资 可 以 诬 定 于 
各 人 的 产 出 , 却 无 法 (直接 ?取决 于 其 努力 水 平 。 

假设 老板 为 激励 工人 努力 工作 ,而 在 他 们 中 间 开 展 工 作 竞赛 , 参见 拉 齐 
尔 和 田 森 (1981) 首 先 建立 的 分 析 模 型 中 。 工 作 竞 赛 的 优胜 者 { 即 产 出 水 平 
较 高 的 工人 }) 获 得 的 工资 为 wn; 失败 者 的 工资 为 wo 工人 获得 工效 水 平 
w 并 付出 努力 程度 e NHN ulw, e) = w- gle), AP gle) RREA 
工作 带 来 的 负 效 用 , 是 递增 的 凸 函 数 ( 即 g (e) >O H g (e) >0),. ZRK 
Wm A yi + yo 一 wae Wie 

现在 我 们 套用 对 第 2.2.A 节 博 奔 类 型 的 讨论 思路 来 分 析 这 一 应 用 。 


中 ”为 使 对 这 一 应 用 的 分 析 保 畦 简洁 .我 们 略 去 了 睹 个 技术 网 节 , 比如 保证 工人 的 一 阶 条 笠 充 
TEAR. Tae THAR HATS RAS Re a, Bea ok at — 
用 ,而 不 会 影 响 理解 的 连贯 性 。 
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老板 为 参与 者 1, 他 的 行动 a, 是 选择 工作 竞赛 中 的 工资 水 平 wp 和 wi, 这 
里 不 存在 参与 者 2。 两 个 工人 是 参与 者 3 和 4, 他 们 观测 第 一 阶段 选 定 的 工 
资 水 平 ,然后 同时 选择 行动 a, 和 aa, 具体 地 说 就 是 选 定 的 努力 程度 el 和 
eao《 后 面 我 们 将 考虑 另 一 种 可 能 性 ,就 是 对 老板 选 定 的 工资 水 平 , 工人 人们 
不 愿意 参与 工作 竞赛 , 却 转 而 寻找 另外 的 工作 机 会 ) 最 后 ,参与 者 各 自 的 收 
益 如 前 面 所 给 出 。 由 于 产 出 (并 由 此 而 使 工资 ) 不 只 是 参与 者 行动 的 函数 ， 
而 且 同 时 还 受 随 机 扰动 因素 ei Me. 的 影响 ,我们 用 参与 者 的 期 望 收益 进 
行 分 析 。 

假定 老板 已 选 定 了 工资 水 平 wp 和 wz, 如果 一 对 努力 水 平 (er ,ez ) 是 
第 二 阶段 两 工人 博弈 的 纳什 均衡 , 则 对 每 个 i, e* 必须 使 工人 的 期 望 工 资 
碱 去 努力 带 来 的 负 效 用 后 的 净 收 益 最 大 , 亦 即 e; 必须 满足 :9 

max wyProb| y; (ei) > yie; )| + wiProbi yle) S yle t- gle) 


= (wn w )Prob| y;(e;) >»; Ce} )} + wi- ge) - (2.2.4) 
其 中 yille) = eit eio (2.2.4) 的 一 阶 条 件 为 


QProb! yi(ei)> vile; yt _ 
Cw w} Be. T 


也 就 是 说 , CA : RES ARE e, 从 而 使 得 额外 努力 的 边际 负 效 用 g 
Ce) 等 于 增加 努力 的 边际 收益 , 后 者 又 等 于 对 优胜 者 的 奖励 工资 wa- 
wr; 寄 以 因 努 力 程 度 提高 而 使 获胜 概率 的 增加 。 

ARAB Dl H WIE YO 

Prob] y,;(¢;} > yle Ji = Proble; > ej teje] 


ge). (2.2.5) 


= f Probie; > e; + ej- e; | el fle;) de; 
g 


=f [1- Fle; — e; + ej) ] fle) de, > 
”于 是 ,一 阶 条 件 (2.2.5) 可 化 为 


中 在 (2.2.4) 式 中 , 我 们 隐 含 了 一 个 前 提 , 即 规定 随机 扰动 项 的 密度 ft} 满足 两 个 工人 人 产 出 
水 平 刚好 相等 的 概率 为 0, 从 而 在 求 得 下 人 期 望 芍 用 时 不 必 考 虑 这 种 情况。 ( 较 正 式 地 说 , 我 们 要 
ESE GSE ffsy 没 有 栖 点 ) 在 对 工作 竞赛 的 完全 分 析 中 , SIH eRe (ERR 
SST LAGE wyt w )/2 ART A RA EMA RAKES). 

@ Merwe MRE TOR pt Al B)MSH, Se St 吾 已 经 发 生 杀 件 下 事件 4 发 生 的 {条 
IPAE., $ pC A). pC BA pA, BRATR A REB REENA BARRERAE 
AMS SRAMNSAEM HERR), MEAE p(AlB)=p(A,B)/ p(B), WHR, 
BREW A 发 生 的 条 忻 概 率 等 于 A BARRE RRR RE RE, 
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Cwn- wr) | fle; — e + ej) fCedde; = gle). 
ej 
在 对 称 的 纳什 均衡 ( 即 er =e2 =e"), 我 们 有 
Cwn w) | fle; de; = gle"). (2.2.6) 
时 


由 于 &(e) 是 凸 函 数 , 优胜 获得 的 奖励 越 高 ( 即 wn 一 wr HERA) RSM 
发 更 大 的 努力 ,这 和 我 们 的 直觉 是 一 致 的 。 另 一 方面 ,在 同样 的 奖励 水 平 
下 ,对 产 出 的 随机 挑动 因素 越 大, 越 不 值得 努力 工作 , 因为 这 时 工作 竞赛 的 
最 终结 果 在 很 大 程度 上 是 决定 于 运气 ,而 非 努 力 程度 。 例 如 , 当 e 服从 方差 
oo? 的 正 态 分 布 时 , 则 有 

1 


2 = 

它 随 o 的 增加 而 下 降 , 也 就 是 说 e "的 确 随 o 的 增加 而 降低 。 

下 面 我 们 从 后 往 前 分 析 博 弈 的 第 一 阶段 。 假 定 工 大 们 同意 参加 工作 竞 
赛 ( 而 不 是 去 另 谋 高 就 ), 他 们 对 给 定 的 wp 和 wi 的 反应 ,将 会 是 (2.2.6) 
描述 的 对 称 的 纳什 均衡 战略 。( 从 而 我 们 忽略 掉 存 在 不 对 称 均衡 的 可 能 性 ， 
以 及 工大 的 努力 程度 由 骨 解 e1 = ez=0 而 不 是 由 一 防 条 件 (2.2.5) 给 出 的 
可 能 性 )? 辐 时 假定 工人 可 寻求 其 他 就 业 机 会 ,得 到 的 效用 为 Us。 因 为 在 对 
称 的 纳什 均衡 中 每 个 工人 在 竞赛 中 获得 优胜 的 概率 为 172( 即 )Prob | y; 
Ce’ }>yCe" 让 =172), 如 果 老 板 要 使 工人 有 动力 参加 工作 竞赛 , 则 他 必须 
选择 满足 下 式 的 工资 水 平 


ayt yw -gle )BU, . (2.2.7) 


假设 U, EPE, 以 致 于 老板 愿意 激励 工人 参加 竞赛 , 则 他 会 在 (2.2.7) 的 
HRR IETF, 选择 使 自己 期 望 收 益 2e”- wy- w, 最 大 的 工资 水 平 。 由 于 
在 最 优 条 件 下 ,(2,.2.7) 中 的 等 导 成 立 : 

wL =2U,+2¢le*)— wy. (2.2.8) 
则 期 望 利润 就 成 为 2e” -2U, -2gfe”), 于 是 老板 要 考虑 的 问题 就 是 使 
ee” 一 gle”’) 最 大 化 ,这 时 他 选择 的 工资 水 平 应 使 得 与 之 粗 应 的 e" 满足 这 
一 条 忻 。 从 而 最 优选 择 下 的 努力 程度 满足 一 阶 条 件 e et), ARRA 
{2.2.6) 则 意味 着 最 优 激励 wy 一 mr 满足 

Cwn — wid] f(s Pde, -1 
和 (2.2.8) 一 起 ,可 解 得 wn M w, H., 
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2.3 Sar 


本 节 我 们 分 析 在 参与 者 之 间 长 期 重复 的 相互 往来 中 , 关于 将 来 行动 的 
威 及 或 承诺 能 香 影 响 到 当前 的 行动 。 大 部 分 直观 的 缚 论 是 由 两 阶段 的 例子 
第 出 的 ,也 有 一 些 观点 需要 讨论 无 限 次 的 情况。 同时 , 我们 还 将 定义 重复 博 
弈 中 子 博弈 精 炬 纳什 均衡 的 概念 ,这 一 定义 在 重复 博 讲 的 条 件 下 表述 较 容 
易 理解 ,而 在 第 2.4.B 节 分 析 一 般 的 完全 接 息 动 态 博弈 中 则 要 复杂 一 些 。 
我 们 在 本 节 先 作 一 简要 介绍 , 以 方便 后 面 的 展开 。 


2.3.A ME POR Be ie 


考 看 图 2.3.1 给 出 的 因 徒 困境 的 标准 式 ,假设 两 个 参与 者 村 把 这 样 一 
个 同时 行动 博弈 重复 进行 两 次 , 且 在 第 二 次 博弈 开始 之 前 可 观测 第 一 次 进 
TTA ZAR, 并 假设 整个 过 程 博 弈 的 收益 等 于 两 阶段 各 自 收益 的 简单 相 加 ( 即 
不 考虑 贴现 因素 ), 我 们 称 这 一 重复 进行 的 博弈 为 两 阶段 囚徒 困境 。 它 属于 
第 2.2.A 节 分 析 过 的 博弈 类 型 ,这 里 参与 者 3、4 与 参与 者 1.2 是 相同 的 ， 
行动 空间 A, 和 A, 也 与 A, A. 相同 ,并 且 总 收益 U; Ca), a2, a3, ad 等 于 
第 一 阶段 结果 (ai a2) 的 收益 与 第 二 阶段 结果 tas, a4}) 的 收益 简单 相 加 。 
而 且 , 两 阶段 囚徒 困 境 满足 我 们 在 第 2.2.A 节 所 作 的 假定 ;对 每 一 个 第 一 
阶段 的 可 行 结 果 (a1, a2), 其 余部 分 在 参与 者 3 和 4 之 疝 进 行 的 博弈 都 存在 
惟一 的 纳什 均衡 ,表示 为 (ay lanar) aa (ai ar) REEL, ANERE 
困境 满足 比 上 述 假 定 更 为 严格 的 条 件 : 在 第 2.2.A 节 中 ,我 们 允许 其 余 第 
二 阶段 博弈 的 纳什 均衡 依赖 于 第 一 阶段 的 结果 -一 -从 而 我 们 表示 为 (a3 
(a1,42),a4 (a1;42)), 而 不 是 简单 的 (a3 ,ay ) (例如 在 关税 博弈 中 , 第 二 
阶段 企业 选择 的 均衡 产量 决定 于 政府 在 第 一 阶段 所 选择 的 关税 ), 但 在 两 阶 
朋 固 徒 困境 中 ,第 二 阶段 博弈 惟一 的 纳什 均衡 就 是 ( 工 ,, 工 ), 不管 第 一 阶段 
的 结果 如 何 。 

参与 者 2 
L: Ry 


BAB Li 1.1 | 5.0 | 


R2 0,5 4,4 


2.3.1 
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参与 者 2 


参与 者 1 


图 2.3.2 


根据 在 第 2.2.A 节 讲 过 的 求解 此 类 博弈 子 博弈 精炼 解 的 程序 ,第 二 阶 
Br te FF ho SR AA RT RR at BE TIS, EB, 即 为 (Li， 
L2), AAW tt A(1,1), 我 们 在 此 前 提 下 分 析 两 阶段 办 徒 困境 第 一 阶段 的 
情况 。 由 此 ,两 阶段 因 徒 困境 中 , 参与 者 在 第 一 阶段 的 局 势 就 可 归纳 为 图 
2.3.2 所 示 的 一 次 性 博弈 ,其 中 , 第 二 阶段 的 均衡 收益 (1,17 分 别 被 加 到 两 
大 第 一 阶段 每 一 收益 组 合 之 上 。 图 2.3.2 所 示 的 博弈 同样 有 惟一 的 纳什 均 
衡 ;(Li, 工 2}。 从 而 ,两 阶段 因 徒 困境 惟一 的 于 博弈 精炼 解 就 是 第 一 阶段 的 
(Li 上 2) 和 随后 第 二 阶段 的 (上 L1, L2)。 在 子 博弈 精炼 解 中 , 任 一 阶段 都 不 
能 达成 相互 合作 一 一 (Ri, 民 2) 的 结果 。 

这 一 结论 在 更 为 一 般 的 条 件 下 同样 成 立 ( 这 里 我 们 暂时 离开 两 阶段 的 
例子 ,人 允许 任何 有 限 的 了 次 重复 }。 令 G= [4 Aat ,ttn| 表 示 一 
个 完全 信息 博弈 ,其 中 参与 者 1 到 a 同时 从 各 自 的 行动 空间 4 到 A 中 分 
别 选 择 行动 a, 到 an, 得 到 的 收益 分 别 为 ilai s anhs Halan os 
ar) 此 后 我 们 称 博 弈 G 为 重复 博弈 中 的 阶段 博 变 。 


定义 ”对 给 定 的 阶段 博弈 G, 令 G(T) 表 示 G 重复 进行 工 次 的 有 限 重 
复 博 弈 , 并 且 在 下 一 次 博弈 开始 前 , 所 有 以 前 博弈 的 进行 都 可 被 观测 到 。G 
(T) 的 收益 为 T 次 阶段 博弈 收益 的 简单 相 加 。 


定理 ”如果 阶段 博弈 G 有 惟一 的 纳什 均衡 , 则 对 任意 有 限 的 工 , 重复 
Se G(T) 有 惟一 的 子 博弈 精炼 解 , 即 G 的 纳什 均衡 结果 在 每 一 阶段 重复 
进行 。? 


四 “在 阶段 博弈 CG 为 完全 信息 动态 博弈 时 类 似 结 论 同 样 成立 。 设 全 属于 第 2.1.A WAM 
的 完全 且 帘 美 信息 动态 博弈 ,如果 G AER Ae, GT) FRR. 其 中 
每 一 阶段 的 结果 都 是 GC HDI, BC AR... ATER HBA RES, 如果 CA 
惟一 的 子 博 弈 精炼 解 , 则 GT) 也 有 惟一 的 子 博弈 精炼 肯 :G 的 子 博弈 精炼 解 午 复 进行 工 次 。 
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FA 2.3.3 


现在 , 我 们 回 到 两 阶段 博弈 ,进一步 沽 虑 阶段 博弈 G 有 多 个 纳什 均衡 
的 情况 ,如 图 2.3.3 所 示 。 战 略 L; AM, 与 图 2.3.1 所 示 的 囚徒 困境 完全 
相同 , 只 不 过 增加 了 战略 R 使 博弈 有 了 两 个 纯 战 略 纳什 均衡 :其 一 是 囚徒 
困境 中 的 (上 L1, Ll), BINEA (RR). KPT PEE ADE E 
加 了 一 个 均衡 解 当 扫 是 很 主观 的 ,但 在 此 博弈 中 我 们 的 兴趣 主要 在 理论 上 ， 
而 非 其 经 济 学 意义 。 在 下 一 节 我 们 将 看 到 , 即使 重复 进行 的 阶段 博弈 像 四 
HOY PE, HE FEM. RL 
出 这 里 斯 分 析 的 多 均衡 特征 。 有 从 而 , A FR ATE A PS EG TBF 
桥 一 个 抽象 的 阶段 博弈 ,以 后 再 分 析 由 有 经 济 学 意义 的 阶段 博弈 徇 成 的 无 
限 重复 博弈 也 就 十 分 容易 了 。 

设 图 2.3.3 表示 的 阶段 博 穿 重 复 进行 两 次 , 并 在 第 二 阶段 开始 前 可 以 
观测 到 第 一 阶段 的 结果 ,我 们 可 以 证 明 在 这 一 重复 博弈 中 存在 一 个 于 博弈 
精炼 解 ,其 中 第 一 阶 侦 的 战略 组 合 为 (Mi M2) 8。 和 第 2.2.A 节 相同 , B 
定 在 第 一 阶段 参与 者 预测 第 二 阶段 的 结果 将 会 是 下 一 阶段 博弈 的 一 个 纳什 
均衡 , 由 于 这 里 阶段 博 守 有 不 止 一 个 纳什 均 本, 因而 参与 者 可 能 会 预测 根据 
第 一 阶段 的 不 同 结果 ,在 第 二 阶段 的 博弈 中 将 会 出 现 不 同 的 纳什 均衡 。 例 
如 , 设 参 与 者 预测 如 果 第 一 阶段 的 结果 是 (M1, M) 第 二 阶段 的 结果 将 会 
是 (Ri, Ra), 而 如 果 第 一 阶段 中 其 他 8 个 结果 的 任何 一 个 出 现 , 第 二 阶段 的 
+e OMSL, L2), 那么 参与 者 在 第 一 阶段 所 面临 的 局 势 就 可 归 为 图 
2.3.4 所 示 的 一 次 性 博 蛮 ,其 中 在 (Mi, M;) 单 元 加 上 了 (3,3), ERA 8 个 
单元 各 加 上 1{1,1)。 


D 严格 地 讲 , 我 们 只 针对 第 2.2.& Te Be A ee EE a, Pe ER 
悄 于 这 一 类 型 ,因为 对 每 一 个 第 一 阶段 博 讲 的 可 行 结果 , 其余 第 二 阶段 博弈 都 有 惟一 的 纳什 均衡 。 
而 基于 图 2.3,.3 为 阶段 博 赫 的 酚 阶 县 蛋 复 博 音 不 属于 这 一 类 型 ,因为 其 阶 且 博弈 有 多 个 纳什 均 疾 。 
这 里 , RAT Fe ET SO, AFAR RS, 其 一 因为 定 交 所 
需 的 变动 极 徽 ; 其 二 , 在 第 2.3.B 节 和 第 2.4.HE 节 中 和 将 会 用 到 更 为 一 般 的 定之 。 


2 SERA SMF 67 


Ls My Ry 

L, 2,2 6,1 1.1 

M1 1,6 7,7 1,1 

Ri 4,1 Lt 4,4 
2.3.4 


在 图 2.3.4 BERRE 3 个 纯 战 略 纳什 均衡 :(L1, 工 2 (Mi, M2) 7 
(Ry, 民 2)。 和 在 图 2.3.2 中 一 样 ,这 个 一 次 性 博弈 中 的 纳什 均衡 对 应 着 重 
复 博 斌 的 子 博 突 精炼 解 。 令 (Cw, rh (yo, ARERR AAR 
第 一 阶段 和 第 二 阶段 的 行动 分 别 为 (ww, Ay, z). 2.3.4 中 的 纳什 均 
PLi 工 z) 对 应 着 重复 博 变 的 子 博 弈 精 卉 解 (( 工 + La), (Li. La)), 因为 除 
第 一 阶段 的 结果 是 {Mi, M;) 外 ,其 他 任何 情况 发 生 时 ,第 二 阶段 的 结果 都 
HE Li ba. A, 2.3.4 中 的 纳什 均衡 (Ri ROWE BR BE 
的 子 博 蛮 精炼 解 ((R1, Ro (Lp Le). BS RSS Ak PS ee A AR e 
简单 地 由 两 个 阶段 博弈 的 纳什 均衡 解 相 串 而 成 , 但 图 2.3.4 里 的 第 三 个 纳什 
均衡 结果 却 与 前 两 者 看 在 质 的 差别 :图 2.3.4 中 的 (Mi No) 对 应 的 重复 博 弃 
子 博弈 精炼 解 为 (( Mi M) (Rio Ro) 因为 对 (Mi, Mo) 之 后 的 第 二 阶段 结 
FAM HAC R o 民 2 , 亦 即 正如 我 们 前 面 讲 过 的 ,在 重复 博弈 的 子 博 弃 精 炼 解 
中 ,合作 可 以 在 第 一 阶段 达成 。 下 面 是 更 为 一 般 的 情况 :如 果 G= 1A1,…， 
Anue o 4, (TARE TAS OY Re is BRAS, 则 重复 博弈 G 
{《T) 可 以 存在 子 博弈 精炼 解 ,其 中 对 每 一 ;<T, 1 阶段 的 结果 都 不 是 G 的 纳 
什 均衡 ,下 一 节 我 们 在 讨论 无 限 重 复 博 弈 时 还 将 涉及 这 一 理念 。 

这 个 例子 要 说 明 的 主要 观点 是 , 对 特 来 行动 所 作 的 可 信 的 威胁 或 承 
诺 可 以 影响 到 当前 的 行动 。 不 过 另外 一 点 ,也 说 明了 子 博 弈 精 炬 的 概念 
对 可 入 性 的 要 求 并 不 严 略 。 鲍 如 , 在 推导 子 博弈 精炼 解 ((C Mi, Mo), 
CR, RR2)) 时 , 我 们 假定 如 果 第 一 阶段 的 结果 是 (M1, M2), 则 参与 双方 
都 预期 (Rl, R,) 将 是 第 二 阶段 的 解 , 如果 第 一 阶段 出 现 了 任何 其 他 8 种 
结果 之 一 , 第 二 阶段 的 结果 就 会 是 (Li, L;)。 但 基 , 由 于 第 二 阶段 的 博 
EH, (Ri, 民 ;) 亦 为 可 选择 的 纳什 均 奖 , 而 相应 的 收益 为 (3,3), 这 时 选 
RBA, 1) 的 (上 L1, 工 ;) 看 起 来 就 比较 轧 塞 了。 不 严格 地 看 , Som 
方 进行 重新 谈判 似乎 是 很 自然 的 事 P。 如 果 第 一 阶段 的 结果 并 不 是 


D 之 所 以 说 不 严 粘 ,全 为 "重新 谈判 "意味 着 在 第 一 春 段 和 第 二 阶 眉 中 间 发 生 了 交流 (甚至 是 
讨价还价 }。 如 果 此 类 行为 是 允许 的 , 则 它们 应 包含 在 对 博弈 的 定义 及 分析 之 中 。 这 里 我 们 假定 瘀 
有 此 交行 为 发 生 ,因而 “重新 谈判 "在 上 邮 可 理解 为 在 内 心 对 局 势 的 分 析 。 
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(Mi AMfz)， 从 而 机 方 第 二 阶段 的 行动 庶 该 是 人 工人 ,那么 每 一 个 参与 
者 可 能 会 理性 地 认为 过 去 的 反正 已 经 过 去 了 ,在 余下 的 阶段 博弈 中 就 会 
选择 双方 都 念 好 的 均衡 行动 (Ri, R，,)。 得 是 如 果 对 每 个 第 一 阶段 的 结 
果 , 第 二 阶段 的 结果 都 将 是 (Rl, RR;) 的 话 , US — Br Be HEC M,, M;) 的 
动机 就 被 破坏 了 ;两 个 参与 者 在 第 一 阶段 面临 的 局 势 就 可 以 简化 表示 为 图 
2.3.3 所 示 阶 段 博弈 的 每 一 单元 格 中 的 收益 都 衣 上 53,3) 司 形成 的 一 次 性 
EF, TE i 对 Mj 的 最 优 反应 就 成 为 工 ;。 

为 说 明 这 一 重新 谈判 问题 的 解 代 思路, 我们 考虑 图 2.3.5 所 示 的 博弈 。 
和 图 2.3.3 的 博弈 相 比 , 它 的 人 为 设计 的 痕迹 更 为 明显 。 辐 样 ,我 们 对 这 一 
博弈 的 分 析 只 为 了 说 明 柯 题 , 而 不 考虑 其 经 济 学 含义 ,从 这 一 人 为 博弈 中 我 
们 得 出 的 有 关 重 新 谈判 的 观点 , 亦 可 应 用 于 对 无 限 重 复 祖 蛮 中 重新 谈判 的 
分 析 ; 参 见 法 雷 尔 罗 和 马 斯 金 (1989) 提 供 的 例子 。 


这 里 的 阶段 博弈 在 图 2.3.3 的 基础 上 叉 加 上 了 战略 p; MQ, 从 而 阶 
REFA TAA AER A I: Lr, LOR R Ra), 同时 又 增加 了 (Pi， 
P,)#1(Q1,92). SEAR, M(L,, 上 2) 相 比 ,参与 双方 都 更 倾向 于 选择 
(Ri, RR2)。 但 更 重要 的 ,图 2.3.5 的 博弈 中 ,不 存在 一 个 纳什 均衡 (xz, y), 
使 参与 双方 和 {P,P2) 或 (Qi, QRR, R) HE, PEM FRE (x, 
y)。 我 们 称 {RR1, R2) t6 RHEI F (Paretodominates) (Li, L2), M E(P}, 
P2).€Q), QDA R, Ro AAT 2.3.5 所 示 搏 弈 的 纳什 均衡 收益 的 帕 
¥ F631 FF ( Pareto frontier) 之 上 。 . 

设想 图 2.3.5 的 阶段 博弈 重复 进行 两 次 , HEEL BRT 
测 到 第 一 阶段 的 结果 。 进 一 步 假设 参与 者 预期 的 第 二 阶段 结 困 如 下 ;如 果 
第 一 阶段 的 结果 为 (M1, Mh 第 二 阶段 将 是 (Ri, 民 2) ;第 一 阶段 (Mi, w), 
其 中 w BRM, 之 外 的 生意 战略 , 则 (P,P,); 第 一 阶段 (x, Mah AP a 


2H XSF aE 69 


ABR M, 之 外 的 任意 战略 , 则 (QQaz); 第 一 阶段 (y, =), 其 中 为 除 M 之 
外 的 任何 战略 , x 为 除 Ma 之 外 的 任何 战略 , 则 (RiRz)y。 那 么 (AI M2), 
(Roe 及 2) 就 是 重复 博弈 的 子 博 讲 精 炬 解 ,因为 先 选 Mi ,接着 选 R, 每 个 参 
与 者 都 可 得 到 4+3 的 收益 ,但 在 第 一 阶段 偏离 这 一 选择 而 选 工 ,, 却 只 能 得 
到 5+ 172( 选 择 其 他 行动 的 收益 其 至 更 低 )。 更 为 重要 的 是 , 前 一 例子 中 过 
到 的 困难 在 这 里 并 没有 出 现 。 在 基于 图 2.3.3 的 两 阶段 重复 博弈 中 , 对 一 
个 参与 者 在 第 一 阶段 不 守信 用 的 配 罚 , 只 能 是 在 第 二 阶段 的 帕 票 托 居 沙 均 
W., MATRA ET ETA. ER RSS PAM, 有 三 个 均衡 处 于 帕 累 托 
边界 之 上 一 一 其 中 之 一 可 以 奖励 参与 双方 在 第 一 阶段 的 良好 行动 , 另外 两 
个 则 可 以 在 短 罚 第 一 阶段 不 守信 用 者 的 同时 ,奖励 每 罚 者 。 从 而 ,一 旦 在 第 
二 阶段 有 必要 实施 千 罚 ,惩罚 者 就 不 会 再 考虑 选择 阶段 博弈 的 其 他 均衡 , 于 
是 也 就 无 法 说 服 生 罚 者 就 第 二 阶段 的 行动 进行 重新 谈判 。 


2.3.B Mi ARs ez 


ATRINA ZH ARER AEH. ATH AR BS esa 
EL PD eR SP Le SEE TT H a E A ake A Og EY SE FT 
动 。 在 有 限 情况 的 例子 中 我 们 已 看 到 , 如 果 阶 段 博弈 G 有 多 个 纳什 均衡 ， 
重复 博弈 COT RIRSGET SRR, 其 中 对 任意 <T, 阶段 上 的 
结果 都 不 是 G 的 詹 什 均 奖 。 在 无 限 重复 博弈 中 一 个 更 强 的 结论 成 立 : 即 使 
阶段 博弈 有 惟一 的 纳什 均衡 , 无 限 重复 博弈 中 也 可 以 存在 子 博弈 精炼 解 , 其 
中 没有 一 个 阶段 的 结果 是 G 的 纳什 均衡 。 

首先 , 我们 研究 无 限 重 复 的 囚徒 困境 博弈 ,接着 再 讨论 和 前 一 节 定 义 的 
有 限 重 复 博弈 类 型 相 辣 的 无 限 重复 博弈 ;一 个 完全 信息 静态 博弈 G, 被 无 
限 次 重复 进行 , 并且 在 下 一 阶段 开始 时 ,之 前 所 有 阶段 的 结果 都 可 以 被 观测 
到 。 对 这 一 类 型 的 有 限 重 复 或 元 限 重复 博弈 , 我 们 定义 参与 者 的 战略 、 子 博 
弈 和 子 博 弈 精炼 纳什 均衡 (在 第 2.4.B 节 , 我 们 对 一 般 的 完全 信息 动态 博 
弈 定义 上 述 概念 ,而 不 仅 包 含 这 一 特定 类 型 的 重复 博弈 )。 此 后 , 我 们 运用 
这 些 业 念 给 出 并 证 明 弗 里 答 昌 (1971) 的 定理 ( 亦 称 为 无 名 RED) 


灾 ” 开 始 时 的 无 名 氏 定 理 分 析 了 一 个 有 限 重 复 博 弈 前 全 部 纳什 均衡 的 收益 。 这 一 结论 额 浆 为 
REKREA, 基因 为 尽管 无 人 发 表 , 世 在 和 年 代 就 妃 广 为 博弈 论 学 者 所 知 。 理 里 德 旺 (19717 的 定 
理 则 分 析 了 了 有限 便 复 博弈 的 特定 子 博弈 精 坎 纳什 均 交 的 收益 ,由 于 应 用 了 子 博 穿 和 精炼 纳 症 均 交 ,这 
一 较 稍 什 芍 街 条 件 更 强 的 均衡 概念 ,因而 较 当 初 的 元 名 氏 定 理 条 忻 更 强 。 不 过 当初 的 名 字 依 然 沿 
用 下 来 : 弗 里 条 受 的 定理 (和 此 后 的 结论 1) 有 时 称 为 无 名 氏 定 理 , 尽管 在 它们 公开 发 表 之 前 井 未 被 博 
BES SAT AH. 


70 = BSE re aE RY 


B52 2 
La Ry 


Ey 1,1 5,0 


参与 者 1 
R: 0, 5 4,4 


HA 2.3.6 


设想 图 2.3.6 的 囚徒 困境 将 无 限 次 地 重复 进行 , 并 且 对 每 个 :, 在 第 : 
阶段 开始 前 的 :~ 1 次 阶段 博弈 的 结果 都 可 被 观测 到 。 将 这 无 限 次 阶段 请 
弈 的 收益 简单 相 加 , 对 衡量 参与 者 在 无 限 次 重复 博弈 中 的 总 站 巷 并 无 太 大 
意义 , 比如 每 一 阶段 得 到 的 收益 为 4 显然 要 优 于 每 一 阶段 得 到 的 收益 为 1， 
但 两 者 之 和 却 都 是 无 穿 大 。 前 面 讲 过 (和 鲁 宾 斯 坦 的 讨价还价 模型 ,第 2.1.DD 
节 ) 上 贴现 因子 8=1TACL+r) 为 一 个 时 期 后 的 一 美元 今天 的 价值 ,其 中 > 为 每 
一 防 段 的 利率 。 给 定 一 个 贴现 孙子 及 参与 者 在 无 限 次 博弈 中 每 次 的 收益 ， 
我 们 可 以 计算 收益 的 现 倘 一 一 如 果 现 在 把 这 笔 钱 存 入 银行 , 在 一 定期 间 结 
WEET, 银行 存款 的 余额 与 那 时 可 得 到 的 金额 相等 。 


定义 ”给 定 贴现 因子 3, 无 限 的 收益 序列 ey, xz, xs,… 的 现 值 为 


xi t r +t 他 2 和 rs + -= Do ir, . 
‘= 


借助 于 贴现 因子 6 ETUER SAARES HSARR t 
BARES He, PERAK MRSA KR RLY, AE EEN 
§-PASRS BEM KM BRERSBHAREAR. WRB 
弈 立刻 结束 的 概率 为 p, 则 博弈 将 至 少 再 进行 一 个 阶段 的 概率 为 1 pp, 在 
下 一 阶段 将 可 以 得 到 的 收益 {如 果 能 继续 进行 )x, 在 当前 阶段 的 硬币 未 挤 
之 前 的 价值 只 有 (1 一 pp)x/t1+ rr)。 与 之 相似 ,在 两 个 阶段 之 后 可 能 得 到 的 
收益 (如果 后 面 两 个 阶段 都 能 继续 进行 )r, 在 当前 阶段 的 硬币 未 掷 之 前 的 
HAEREA- pYrae/(itry’, 令 8= C1- py/(+tr), 则 现 值 x, + Bra+ 
82xs+T… 钱 包含 了 货币 的 时 间 价 值 ,又 包含 了 博弈 将 要 结 训 的 可 能 性 。 

下 面 我 们 分 析 无 女 重 复 的 因 徒 困境 博弈 , 其 中 每 一 参与 者 的 贴现 因子 
都 为 人 , 旦 每 一 参与 者 在 重复 博弈 中 得 到 的 收益 等 于 各 自在 所 有 阶段 博 蛮 
中 得 到 收益 的 现 值 。 我 们 将 证 明 尽 管 阶 眉 博弈 中 惟一 的 纳什 均衡 是 不 合 
作 BIC Li, La) HERETER — TT RR, 每 一 阶 
Ea 2a Re SS R, R，)。 论 证 中 要 运用 我 们 分 析 基 于 图 
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2.3.3 的 两 阶段 重复 博弈 时 的 思想 (在 该 阶 盘 博弈 中 我 们 在 因 徒 困境 的 基 
础 上 加 入 了 第 二 个 钙 什 均衡 ): 如 果 目 前 参与 者 相互 合作 , 则 下 一 阶段 他 们 
将 选择 高 收益 的 均衡 结果 ,否则 将 选择 低 收益 的 均衡 结果 。 两 阶段 重复 博 
弈 和 无 限 重复 博弈 的 不 同 之 处 在 于 ,这 里 下 一 次 可 选择 的 高 收益 均衡 , 并 不 
是 人 为 加 在 阶段 博 蛮 之 上 的 另 一 个 均衡 结晶 ,而 是 代表 着 在 下 一 阶段 及 其 
后 的 继续 合作 。 

假设 参与 者 i 在 无 限 重复 博弈 的 开始 选择 相互 合作 的 战略 , 并 且 当 且 
羽 当 前 面 每 个 阶段 套 与 双方 都 选择 相互 合作 时 ,在 其 后 的 阶段 博弈 中 也 选 
择 相 互 合作 。 我 们 可 把 参与 者 i 的 这 一 战略 正式 表述 为 . 

在 第 一 阶段 选择 Ro HER: 阶段 , 如果 所 有 前 面 上 -1 阶段 的 结果 
MCR, R;), 则 选择 R, HME Lio 

这 一 战略 是 触发 战略 (trigget strategy) 的 一 种 ,之 上 所 以 称 为 触发 战略 ， 
是 因为 如 果 没 有 人 选择 不 合作 , 合作 将 一 直 进 行 下 去 ;一 旦 有 人 选择 不 合 
作 , 就 会 触发 其 后 所 有 阶段 都 不 再 相互 合作 。 如 果 参 与 双方 都 采取 这 种 触 
发 战略 , 则 此 无 限 重复 博弈 的 结果 就 将 旦 每 一 阶段 选择 {有 R1, RD). RS 
先 论证 如 果 距 1 足 况 近 , 则 采取 这 种 战略 , 对 参与 双方 都 是 无 狠 重 复 博 
弈 的 纳什 均衡 , 其 后 再 证 明 这 一 纳什 均衡 是 子 博 蛮 精炼 的 , 以 司 论 证 更 为 严 
格 。 

为 证 明 采 取 上 述 触 发 战略 , 对 参与 双方 来 讲 都 是 无 限 重 复 博 弈 的 纳什 
均衡 , 我 们 将 假定 参与 者 i 已 采取 触发 战略 ,并 证 明 在 性 与 于 足 人 能 接近 的 条 
ET, 参与 者 j 的 最 优 反 应 为 也 选择 同样 的 战略 。 由 于 一 旦 某 阶 段 的 结果 
偏离 了 (Ri, R), BSF i 将 在 其 后 永远 选择 Li;, 那么 如 果 某 阶段 的 结果 偏 
离 了 ( 民 1, Rk.) 参与 者 j 的 最 优 反 应 同样 是 在 其 后 永远 选择 L;。 余 下 的 就 
是 计算 参与 者 j 在 第 一 阶段 的 最 优 反 应 ,以 及 前 面 的 结果 都 是 (R,, Rs} 时， 
T-WRMRARM. HEL, 将 会 使 当期 得 到 5 的 收益 ,但 却 会 触发 参与 
者 i 的 永远 不 合作 战略 (从 而 亦 引 发 参与 者 j 本 人 的 不 合作 ), 于 是 未 来 每 
一 阶段 的 收益 都 将 成 为 1。 由 于 1+2+62+…=1/(1 一 人 6), 上 述 一 系列 收 
at BY BE 


. 2p ye eee Oe 
$+ 8-14 87-14 5+5. 


采取 另外 的 战略 ,选择 R; 在 本 期 的 收益 将 为 4, 并 且 在 下 一 阶段 还 可 得 到 
完全 相同 的 选择 机 会 , 令 Y 表示 参与 者 ; 在 (当前 和 以 后 每 一 次 面临 同样 
选择 时 ) 无 限 次 的 选择 中 总 选择 最 优 战略 时 收益 的 现 值 。 如 果 选 择 R 是 
aS, 则 
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V=4+8V , 
或 V=4/(1- 8), 因 为 选择 Ri 时 ,下 一 阶段 还 有 机 会 进行 相同 选择 。 如 果 
选择 L 是 最 优 的 , 则 
-s4 
V=5+7 ss; 
此 结果 前 面 已 经 导出 。 二 是 , SAMS FARE, E R, 为 最 优 ; 


4 
5 4 一 和 
1-37 > *T-6 ， (2.3.1) 


BI 人 关 174。 于 是 , 当 且 仅 当 8 六 174 时 ,在 第 一 阶段 , 并 恒 在 前 面 缚 果 都 是 
(Ry, R2) 的 下 一 阶段 ,参与 者 7 的 最 优 反应 (给 定 参 与 者 i CRT MEK 
略为 Rj。 这 一 结论 , 再 加 上 前 面 已 证 明 的 ,一 旦 茶 一 阶段 的 结果 偏离 了 
(Ro R2),j 的 最 优 反 应 就 是 永远 选择 工 ,, 我 们 已 经 证 明 当 且 仅 当 d1/4 
时 , 参与 双方 都 采取 和 触发 战略 是 博弈 的 纳什 均衡 。 

下 面 我 们 要 论证 的 是 这 一 纳什 均衡 同时 又 是 子 博弈 精炼 的 。 为 做 到 这 
一 点 ,首先 定义 重复 博弈 中 的 以 干 三 个 概念 :重复 博弈 中 的 战略 .重复 博弈 
的 子 博弈 以 及 重复 博弈 的 子 博 弈 精 堪 纳什 均衡 。 为 借助 前 一 节 中 的 简单 例 
子 说 明 这 些 概 念 ,我 们 将 对 有 限 重 复 博 弈 和 无 限 重 复 博 弈 中 的 情况 同时 给 
出 定义 。 在 上 一 节 , 我 们 基于 防 段 博弈 G=j141 tt Anity s a EXT 
有 限 重复 博弈 GT) 其 中 的 G 是 一 个 完全 信息 静态 博弈 ,参与 者 1 到 nm 
同时 从 各 自 的 行动 空间 Al BA, 中 分 别 选 择 行动 ai 到 av, 得 到 收益 ai 
(a ay EU uy Caps, an), MERRIE LAU CEES BE. 


定义 ”给 定 一 个 阶段 博弈 G, 令 G(o,9) 表 示 相 应 的 无 限 重复 博弈 ， 
其 中 G 将 无 限 次 地 重复 进行 ,县 参与 者 的 贴现 因子 都 为 8。 对 每 一 个 i, 之 
BU -1 KRAMER : 阶段 开始 进行 前 都 可 被 观测 到 , 每 个 参与 者 
在 G(co,6) 中 的 收益 都 是 该 参与 者 在 无 限 钦 的 阶段 博 诗 中 所 得 收益 的 更 
值 。 


在 所 有 博弈 (无 论 是 重复 的 还 是 非 重 复 的 ) 中 ,参与 者 的 一 个 战略 都 是 
行动 的 一 个 完整 计划 一 一 它 包 括 了 该 参与 者 在 所 有 可 能 的 情况 下 , 需要 作 
出 选择 时 的 行动 。 更 形象 一 点 讲 , 如 果 一 个 参与 者 在 博弈 开始 前 把 一 个 战 


中 ”我 们 当然 也 可 以 替 于 一 个 动态 阶段 博弈 定 义 一 个 重复 博 许 .本 节 我 们 将 讨论 限于 静态 的 
阶段 博 便 是 为 了 尽 可 稻 简 单 地 说 明 主 要 原理 。 在 第 2.3.D 和 第 2.3.EFE 节 的 应 用 中 就 有 基于 动态 
防 段 博弈 的 重复 博弈- 
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路 留 给 他 的 律师 ,律师 就 可 以 代理 该 参与 者 参加 博弈 , 在 任何 情况 下 都 无 需 
再 征询 参与 者 的 意见 。({ 指 客观 上 不 需要 , 即 各 种 情况 下 应 该 怎么 办 已 由 参 
与 者 的 战略 安排 好 了 ,而 不 是 指 律师 可 以 代理 决策 译注 ) 例 如 一 一 在 一 
个 完全 信息 静态 博弈 中 , 一 个 战略 就 是 一 个 简单 的 行动 (这 也 是 为 什么 我 们 
在 第 1 章 中 将 这 样 的 博弈 表示 为 G = 1S1 e, Spi upt uni MEFE 
表示 为 G= | 4 e Anitu 对 一 个 完全 信息 静态 博弈 而 言 , 参 与 者 ; 
的 战略 空间 S; 即 简 单 等 于 其 行动 空间 A;)。 不 过 在 动态 博弈 中 , 一 个 战略 
就 较为 复杂 了 。 

考虑 前 一 节 分 析 的 两 阶段 办 徒 困境 , 每 一 个 参与 者 都 有 两 次 行动 ,于 是 
也 许 有 人 会 认为 一 个 战略 就 是 一 对 指令 (5&5,c), 其 中 6 是 第 一 阶段 的 行动 ， 
c 是 第 二 阶段 的 行动 。 但 第 一 阶段 有 四 个 可 能 的 结果 一 一 (1, 上;), (Ly, 
Ra) (Ry, LOAR e 民 2) 一 一 它们 代表 了 四 种 不 同 的 情况 ,每 一 参与 者 都 
可 能 针对 这 些 情况 作出 不 同 的 反应 。 从 市 ,每 一 参与 者 的 战略 就 应 包含 5 
条 指令 ,表示 为 (vw, my x,y,z) BE o 为 第 一 阶段 的 行动 , wary Bz 
则 表示 针对 第 一 阶段 的 不 同 结果 (Lj， Lz), (Ly, R2), (CR, Lz) RCRy, 
民 ,), 分 别 应 该 在 第 二 阶段 采取 的 行动 。 使 用 这 一 表示 ,“ 第 一 阶段 选择 b, 
且 不 论 第 一 阶段 出 现 什 么 结果 , 均 在 第 二 阶段 选择 "这 一 指示 就 可 写成 
(8,c,c, cc), 但 这 一 表示 方法 也 可 以 表示 第 二 阶段 行动 依赖 于 第 一 阶段 
结果 的 战略 , 比如 (5, c,c,c,5), 它 的 舍 义 是 “第 一 阶段 选择 5, 如果 第 一 阶 
段 的 结果 是 {Ri, Ro), 则 在 第 二 阶段 选择 b, 否则 第 二 阶段 选择 c” ZW 
地 ,在 基于 图 2.3.3 的 两 阶段 重复 博弈 中 , 每 一 参与 者 的 战略 都 包含 10 条 
指令 一 个 第 一 阶段 的 行动 和 39 个 未 同情 况 下 的 第 二 阶段 的 行动 , 针对 
第 一 阶段 每 一 个 可 能 的 结果 都 有 相应 的 行动 。 请 回 原 在 对 此 两 阶段 重复 博 
PETIA, 我 们 曾 考 虑 过 的 一 个 战略 , 其 中 参与 者 第 二 阶段 的 行动 是 依 
第 一 阶段 结果 而 确定 的 :第 一 阶段 选择 M,, 如 果 第 一 阶段 的 结果 是 CM， 
M,), 则 在 第 二 阶段 选择 R, 如 不 是 , 则 选择 La 

在 有 限 重 复 博 弈 C@(T) 或 无 限 重 复 捕 弈 G(oec, 3) 中 ,博弈 到 阶段 * 的 
进行 过 程 {history of play through stage 1 ) 指 吉方 参与 者 从 阶段 1 到 阶段 1 
所 有 行动 的 记录 。 例 如 ,参与 者 可 能 在 第 一 阶段 选择 (ail; -…, an) 在 第 二 
阶段 选择 (atiz,…，asz)…, 在 第 上 阶段 选择 (a1,,…, am ), 其 中 对 每 一 参与 
者 i, 在 阶段 s 的 行动 ws 属于 行动 集 A;。 


EX 在 有 限 重复 博弈 C(T) 或 无 限 重 复 博 弈 G(ce, 6) 中 ,参与 者 的 
一 个 战略 特 指 在 每 一 阶段 ,针对 其 前 面 阶段 所 有 可 能 的 进行 过 程 , 参与 者 将 
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会 选择 的 行动 。 


下 面 我 们 讨论 子 博 弈 。 一 个 子 博 弈 是 全 部 博弈 的 一 部 分 , 当 全 部 博弈 
进行 到 任何 一 个 阶段 ,到 此 为 止 的 进行 过 程 已 成 为 参与 各 方 的 共同 知 
识 , 而 其 后 尚未 开始 进行 的 部 分 就 是 一 个 子 博 蛮 ( 在 本 节 后 面 的 部 分 我 
们 将 给 出 重复 博弈 G(T) 和 Gi, 85) 的 子 博弈 的 精确 定义 , 在 第 
2.4.B 节 还 将 针对 一 般 的 完全 信息 动态 博弈 给 出 子 博 弈 的 精确 概念 )。 
例如 在 两 阶段 囚徒 困 境 中 ,就 有 4 个 子 博弈 ,分 别 为 第 一 阶段 4 种 可 能 
的 结果 出 更 后 ,第 二 阶段 的 博弈 。 类 但 地 , 在 基于 图 2.3.3 的 两 阶段 博 
弈 中 ,存在 9 个 子 博弈 ,因为 在 第 二 阶段 开始 前 , 第 一 阶段 的 博弈 可 能 会 
出 现 9 个 不 同 的 结果 ,而 每 种 结果 出 现 后 , 第 二 阶段 的 博弈 都 是 一 个 不 
RATRE. CARESS CCTIMARER BEF Gi, sh, 
战略 的 定义 和 子 博 弈 的 定义 关系 非常 密切 SEARS 
者 在 博弈 的 第 一 阶段 选择 的 行动 以 及 在 其 所 有 子 博 弈 的 第 一 阶段 将 要 
选择 的 行动 。 


定义 ”在 有 限 重复 博弈 CCT), 由 第 + 1 阶段 开始 的 一 个 于 博弈 为 
G 进行 工 - :次 的 重复 博弈 , 可 表示 为 G(T 一 :)。 由 第 :+1 阶段 开始 有 
许多 子 博弈 ,到 ; 阶段 为 止 的 每 一 可 能 的 进行 过 程 之 后 都 是 不 同 的 子 博弈 。 
在 无 限 重 复 博弈 Gkoo ,5) 中 ,由 zt+l 院 段 开始 的 每 个 子 博 赛 都 等 同 于 初 
始 博弈 C(ce ,3), 和 在 有 限 情 况 下 相似 , 博弈 Ctco ,3) 到 上 阶段 为 止 有 多 
少 不 同 的 可 能 进行 过 程 ,就 有 窗 少 从 :+ 1 阶段 开始 的 子 博 弈 。 


有 一 点 务 请 注意 , 重复 博弈 的 第 : 阶段 本 身 ( 在 有 限 情 况 下 假定 < 
T) 并 不 是 整个 博弈 的 一 个 子 博 弈 。 子 博弈 是 原 博 穿 的 一 部 分 ,不 只 是 说 博 
弈 到 此 为 止 的 进行 过 程 已 或 为 全 体 参 与 者 的 共同 知识 , 还 包括 了 原 博弈 在 
这 一 点 之 后 的 产 有 进行 。 只 单独 分 析 第 上 阶段 的 博弈 就 等 于 把 第 阶段 看 
成 原 重 复 博 赛 的 最 后 一 个 阶段 ， 这 样 的 分 析 也 可 能 会 得 到 一 些 结论 ， 但 却 完 
全 无 助 于 对 整个 重复 博弈 的 分 析 。 

现在 我 们 可 以 给 出 子 博弈 精炼 纳什 均衡 的 定义 了 , 它 仍 建立 在 纳 秆 均 
衡 的 概念 之 上 。 后 者 和 第 1 章 中 的 定义 并 无 二 致 ,但 这 里 包含 了 在 动态 博 
弈 中 参与 者 战略 的 潜在 复杂 性 :在 所 有 博弈 中 , 纳什 均衡 是 所有 参与 者 的 一 
个 战略 组 合 , 每 个 参与 者 都 有 一 个 战略 ,并且 每 一 参与 者 的 战略 都 是 针对 其 
他 参与 者 战略 的 最 优 反 应 
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定义 ( 塞 尔 滕 (Selten, 1965)) 如 果 参 与 者 的 战略 在 每 一 子 博弈 中 都 构 
成 纳什 均衡 , 我 们 则 说 纳什 均衡 是 子 博 弈 精 冻 的 。 


子 捕 弈 精炼 詹 什 均衡 把 纳什 均衡 的 概念 进一步 严格 化 , 即 一 个 子 博 诗 
AGH SAADEH AM, 然后 还 须 通 过 其 他 检验 。 - 

为 证 明 无 限 重复 囚徒 困境 中 的 触发 战略 纳什 均衡 是 子 博弈 精炼 的 ,我 
们 必须 证 明 触 发 战略 在 此 无 限 重 复 博弈 中 的 每 一 子 博 蹇 中 都 构成 了 纳什 去 
w. RICAN, 无 限量 复 博弈 的 每 一 子 博 弈 都 等 同 于 岩 博 弈 。 在 无 限 息 
复 囚 徒 困 境 的 触发 战略 纳什 均衡 中 ,这些 子 博 弃 可 分 为 两 类 :;{i) 所 有 以 前 
阶段 的 结果 都 是 (Ri, RR2) 的 子 捕 弃 ,和 (1) 至 少 有 一 个 前 面 阶段 的 结果 不 是 
(Rao RR2) 的 子 杰 弈 。 如 淋 参 与 者 在 整个 博 斌 中 采取 触发 战略 , 则 (i) 参 与 者 
在 第 一 类 子 博弈 中 的 战略 同样 是 触发 战略 , 我 们 已 证 明 它 是 整个 博弈 的 一 
个 纳什 均衡 ;ii) 和 参与 着 在 第 二 类 子 请 蛮 中 的 战略 只 是 永远 单纯 重复 阶段 博 
蛮 的 均衡 (Li, 工 2), 它 同样 是 整体 博弈 的 纳什 均 奖 。 从 页 可 以 证 明 , 无 限 重 
复 办 徒 困境 中 的 触发 战略 纳什 均衡 是 子 博弈 精炼 的 。 


参与 者 2 的 收益 


o 


(5,0) 


@.5) (4,4) 


FA 2.3.7 


下 面 我 们 将 相似 的 论证 用 于 无 限 重复 博弈 Gio, 8)。 这 些 论证 将 导 
出 弗 里 楷 曙 (1971) 的 无 限 重 复 博 弈 定理。 为 表述 这 一 定理 ,我 们 还 禹 最 后 
定义 两 个 概念 。 第 一 ,我 们 称 一 组 收益 (xi r ARR G 的 可 行 
收益 (feasible), 如 果 它 们 是 G 的 纯 战 略 收益 的 凸 组 舍 (convex combination) 
{ 即 纯 战略 收益 的 如 权 平 均 ,权重 非 负 上 且 和 和 为 1), 图 2.3.6 PATH RM 
可 行 收益 集合 为 图 2.3.7 中 的 阴影 区 域 。 纯 战略 (1,1), (0, 5), (4, 4) 利 (5， 
0) 都 是 可 行 的 , 其 他 可 行 收益 包括 <a < 之 4 的 所 有 {x, ce) 它们 由 (1,1) 与 
(4,4) 的 加 权 平 均 得 出 ,以 下 满足 y+x=5 HOM y <5 的 所 有 (y, 2), EFT 
由 C0,5) 与 (5,0) 圳 权 平 均 得 出 。 图 2.3.7 阴影 区 域 之 内 的 其 他 组 合 是 由 两 
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个 以 上 的 纯 战 略 收益 加 权 平 均 得 出 的 。 为 达到 纯 战 略 收 益 的 加 权 平 均 收 
益 , 参与 者 可 以 使 用 一 个 共同 的 随机 数 发 生 器 :例如 , 根据 镁 一 校 5 均 勾 ) 硬 
币 的 结果 选择 (Lu 民 2) 或 (Ri, 工 2), 他 们 可 以 得 淹 的 期 望 收 益 为 (2.5， 
2.5)。 . 
ARREARS ER, 我 们 需要 的 第 二 个 概念 用 以 重新 衡量 参与 者 的 
收益 。 我 们 仍 将 每 一 参与 者 在 无 限 重 复 博 弈 G(co,3) 的 收益 定义 为 该 参 
与 者 在 元 限 个 阶段 博弈 中 收益 的 现 值 ,但 我 们 用 同样 元 限 个 收益 值 的 平均 
收益 (average payoff}) 来 崎 示 这 一 现 什 却 更 为 方便 ,平均 收益 措 为 得 到 相等 
的 收益 现 和 值 而 在 每 一 阶段 都 应 该 得 到 的 等 额 收益 值 。 令 贴现 因子 为 5, 设 
无 限 的 收益 序列 my,myra,… 的 现 值 为 Y, 如 果 每 一 阶级 都 能 得 到 的 收益 为 
x, 则 现 值 为 ww (1 一)。 在 贴现 因子 为 时 5, 为 使 x 等 于 无 限 序列 和 ,rzy 05, 
… 的 平均 收益 ,这 两 个 现 值 必须 相等 ,于 是 <= Y(i -人 ), 也 就 是 说 ,平均 收 
益 为 现 值 的 (1 ~ 3). 


定义 ”给 定 贴现 因子 $, 无限 的 收益 序列 zx, nm, we3,… 的 平均 收益 为 
(1 - 8) Stes, . 


和 现 值 相 比 ,使 用 平均 收益 的 忧 点 在 于 后 者 能 够 和 和 阶段 博 弃 的 收益 直接 比 
较 。 鲍 如 ,在 图 2.3.6 的 囚徒 困境 中 ,两 参与 者 在 每 一 阶段 都 可 得 到 4 的 收 
益 , 这样 一 个 无 限 的 收益 序列 的 平均 收益 为 4, 但 现 值 为 4(1- 人)。 不 过 ， 
由 于 平均 收益 只 是 现 值 的 另 一 种 衡量 , 使 平均 收益 最 大 化 即 等 同 于 使 现 值 
最 大 化 。 . 

现在 ,我 们 终于 可 以 给 出 对 无 限 重复 博弈 进行 讨论 的 主要 结果 了 了; 


定理 ( 弗 里 德 曼 , 1971) 令 G 为 一 个 有 限 的 完全 信息 静态 博弈 , 令 
Cer. eR G 的 一 个 纳什 均衡 下 的 收益 , Aa, zx) 表示 GHAR 
他 任何 可 行 收 益 。 如 果 对 每 一 个 参与 者 皇 有 :>e, 且 如 果 信 足够 接近 于 
1, 则 无 限 重 复 博 弈 CCoce,8) 存 在 一 个 子 博弈 精炼 纳什 均衡 , 其 平均 收益 可 
达到 (ie 


这 一 定理 的 证 明 与 我 们 已 给 出 的 在 无 限 重 其 因 徒 困境 中 的 论证 思路 完全 一 
致 ,我 们 将 其 放 在 山 录 2.3.B。 把 这 一 定理 的 结果 扩展 到 一 般 的 既 非 有 限 ， 
亦 非 静态 的 阶段 博弈 , 从 概念 上 讲 毫 无 障碍 , 但 用 符号 表示 却 显 得 有 些 杂 
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企业 2 的 收益 


(5,0) 2 的 收益 


图 2.3.8 


乱 , 上 其 昼 例 子 可 参见 后 面 3 个 小 节 中 的 应 用 。 在 图 2.3.6 的 因 徒 困境 中 , 3k 
里 德 曙 定理 保证 了 图 2.3.8 十 字 钱 右上 方 的 阴影 部 分 都 可 以 成 为 重复 博弈 
的 一 个 子 博弈 精炼 纳什 均 奖 下 的 平均 收益 ,其 前 提 是 贴现 因子 距 1 足够 接 
近 。 

在 本 节 最 后 , 我们 简单 介绍 无 限 重复 博弈 理论 的 两 个 进一步 发 展 ,这 两 
方面 都 由 于 囚徒 困境 的 特殊 性 而 被 掩盖 了 。 在 图 2.3.6 的 (一 次 性 ?囚徒 困 
境 中 , 参与 者 i 通过 选择 L;, 可 保证 至 少 得 到 纳什 均衡 收益 1, 但 是 在 一 次 
性 的 古 诺 双 头 博弈 { 像 第 1.2.A 节 中 描述 的 那样 ) 中 ,一 个 企业 通过 生产 纳 
4129 GAH , 并 不 能 保证 得 到 纳什 均衡 下 的 利润 ;而 一 个 企业 所 能 保证 得 到 
的 惟一 的 利润 为 0, 这 时 它 可 以 完全 停工 。 给 定 一 个 任意 的 阶段 博弈 G, > 
ri; 表示 参与 者 i 的 保留 收益 (reservation payoff) BERKS SH 
行动 , 参与 者 i eR RAKE. MPSA mr< 委 ei( 这 里 e: ARBAB 
癌 定 理 中 使 用 的 纳什 均 寅 下 的 收益 ), 因为 如 果 7; AF e 则 参与 者 再 选择 
其 纳什 均衡 战略 就 不 是 他 的 最 优 反 诬 。 在 因 徒 困境 中 , r = e, RETKEN 
头 博 弈 (此 类 居多 ) 中 ,ri 过 ei。 

富 登 伯 格 和 马 斯 金 (1986) 证 明 对 两 个 参与 者 的 博弈， 弗 里 德 曼 定 理 中 
的 均衡 收益 (feit, ez) 换 为 保留 收益 (ri1, ra), 结论 同样 成 立 。 即 如 果 { zi, zz) 
为 G 的 一 个 可 行 收益 , 且 对 每 个 i RAs, > ri 则 对 足够 接近 于 1 的 3 G 
(oo, ) 存 在 一 个 子 博 弈 精炼 纳什 均衡 ,其 平均 收益 等 于 (x1, zx2), 即 司 对 某 
个 或 双方 参与 者 来 说 , x; < e;。 对 和 参与 者 为 两 方 以 上 的 博弈 , 富 登 伯 格 和 马 
斯 金 给 出 了 一 个 较 宽松 的 条 件 .使 得 定理 中 的 均衡 收益 (el, …, e,) 可 以 普 
入 为 保留 收益 (ri ra do 
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一 个 互补 性 的 问题 同样 有 趣 ; 在 贴现 因子 并 不 “足够 接近 于 1” 时 , 子 博 
弈 精炼 纳什 均 窒 能 达到 什么 样 的 平均 收益 ?” 处 理 这 一 问题 的 思路 之 一 是 令 
等 于 一 个 固定 值 ,并 在 很 设 参与 者 运用 触发 战略 ,一 旦 发 生 任 何 偏离 就 永 
远 转 到 阶段 博 旗 的 纳什 均衡 的 条 件 下 , 计算 可 以 达到 的 平均 收益 。 在 决定 
当前 阶段 是 否 仿 离 时 ,5 越 小 ,下 一 阶段 开始 进行 惩罚 的 效果 就 越 小 。 
然而 ,一般 来 讲 参与 者 总 可 以 比 简单 重复 阶段 博弈 的 纳什 均衡 得 到 更 高 
的 收益 。 第 二 种 方法 ,由 阿布 勤 (Abreu, 1988) 最 先 提出 , 它 基 于 如 下 办 
路 , 即 阻止 一 个 参与 者 偏离 娆 定 战 赂 的 最 有 效 的 方法 是 威胁 该 参与 者 ， 
一 县 偏离 ,就 将 受到 最 严厉 的 可 信和 的 悉 镶 ( 妈 威 胁 该 参与 者 , 一 旦 偏离 ， 
就 将 选择 使 偏离 者 收益 最 低 的 无 限 重 复 博 弈 的 子 博弈 精炼 销 什 均衡 ) 。 
在 绝 大 多 数 博 弈 中 , 永远 转 到 阶 髓 博弈 的 纳什 均衡 并 不 是 最 严厉 的 可 信 
惩罚 ,于 是 有 些 使 用 触发 战略 方法 无 法 达到 的 平均 收益 , 运用 阿布 勒 的 
方法 可 以 达到 。 不 过 ,在 因 徒 困境 中 , 阶段 博弈 的 纳什 均衡 恰好 得 到 保 
留 收益 { 即 e = r), 则 这 两 种 方法 是 等 价 的 。 下 一 节 将 对 这 丙种 方法 分 
别 给 出 相应 的 例子 。 


附录 2.3.B 
本 附录 证 明 弗 里 德 呈 的 定理 。 念 {as, an) AG MTR, A 
tr A Ce "+ En)o 类 似 地 ， (ass ram) HEETTE, -ta £n) 


的 行动 组 侣 。(! 后 面 的 符 导 只 是 象征 性 的 ,因为 它 忽 略 了 要 达到 任意 可 行 收 
益 一 般 都 需要 借助 于 公用 的 随机 数 发 生 器 ) 考 开 以 下 参与 者 的 触发 战略 ， 

在 第 一 阶段 选择 auo EP: 阶段 ,如 果 所 有 前 面 + -1 个 阶段 的 结果 
都 是 (ar t am), WAR a ;否则 选择 auio 

MRSA MARR Aids HS a, 则 无 限 重复 博弈 的 每 一 阶段 的 结 
RAB HEAL acts …,am) ,从 而 (期 望 的 ) 收 益 为 (zl,…,xzs)。 首 先 ,我们 论证 
WE 8 足够 接近 于 1, 则 参与 者 的 这 种 战略 是 重复 博 蛮 的 纳什 均衡 , 其 后 再 
证 明 这 样 一 个 纳什 均衡 是 子 博弈 精炼 的 。 . . 

设想 除 参 与 者 i 2HMASSARBRA Skea. AFA 
某 一 阶段 的 结果 不 是 (a,1,…, a,,), 其 他 参与 者 将 永远 选择 (40,… ,a ;_1 
i+ tn) ,人 参与 者 i 的 最 优 反 应 为 一 旦 某 一 阶段 的 结果 凡 离 了 《a1， 
… am 就 永远 选择 ss。 其 余 就 是 要 确定 参与 者 i 在 第 一 阶段 的 最 优 反 
应 ,以 及 之 前 所 有 阶段 的 结果 都 是 (as …, RRR. > au 为 参 
与 者 i 对 (aas) 的 最 优 偏 高 , 即 ag FE 


max u; (azi, "5 Be i-is Ais Oy feds tn) . 
ace Ai 
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S d; 为 i 从 此 偏离 中 得 天 的 收益 :di = ce lagts s Gr, -1 Adis Az, eed 
aza)( 再 一 次 我 们 忽略 了 随机 数 发 生 器 的 作用 : 最 优 偏离 及 其 收益 可 以 依赖 
于 随机 数 发 生 器 产生 的 纯 战 略 )。 我 们 有 dj ez; = ular ari Axis 
arit dm) > ;= Ui (aes s am) o 

选择 aa EE BB BEA d, EARR R EAS A hE 
Caes 7s Beg 19 Beets Gamo 对 比 参 与 者 i 的 最 优选 择 为 ai， 于 是 未 来 
每 一 阶段 的 收益 都 将 是 e。 这 一 收益 序列 的 现 值 为 


dit tet Ò tetee =d+ ae 


《由 于 任何 偏离 都 将 触发 其 他 参与 者 的 相同 反应 , 我 们 只 需 考 虑 能 带 来 最 大 
收益 的 偏离 就 足够 了 )。 另 一 方面 ,选择 a,; 将 在 本 阶段 得 到 收益 zx,, 并 且 在 
下 一 阶段 可 在 aas 和 az= 之 间 进 行 完 全 相同 的 选择 。 令 V 表示 参与 者 i 就 
此 作出 最 优选 择 时 各 阶 航 博弈 收益 的 现 值 (目前 及 其 后 每 一 次 面临 这 样 选 
择 时 )。 如 果 选 择 a 是 最 优 的 , 则 
Vi=2;+6V; 或 VW=xi/(1-8). 
如 朵 选择 sa 是 最 优 的 , 则 
全 
1-6 
此 式 前 面 已 经 导出 (假定 随机 数 发 生 器 序列 不 相关 (serially uncorrelated), 
则 令 d: 为 参与 者 i 偏离 随机 数 发 生 器 确定 的 不 同 纯 战略 可 能 得 到 的 最 高 
BERET) WA, HERH FARTA a,: 蚌 最 优 的 
aj — x; 
podte 或 ?一 已 一 

从 而 ,在 第 一 阶段 , 并 且 在 之 前 的 结果 都 是 (a,1,…, a ) 的 任何 阶段 , 当 且 
T Sl 一 zj/(di 一 ei) 时 ,参与 者 i 的 最 优 行动 (给 定 其 他 参与 者 已 采 
用 了 触发 战略 ) 是 so 

给 定 这 一 结果 二 及 一 旦 某 一 阶段 的 结果 偏离 了 (an,…,a), 则 1; 的 
最 优 反 应 是 永远 选择 as, 我 们 得 到 当 且 仅 当 下 式 成 立时 , 所 有 参与 者 采用 
开始 时 描述 的 触发 战略 是 纳什 均衡 


d, 
6 max A 


Vi= di+ fi’ 


一 z; 


由 于 der, > ei 对 每 一 个 1 MER ld- = /Ca - e) <1, 那么 对 所 有 
参与 者 上 式 的 最 大 值 也 一 定 严 格 小 于 1。 
. 余下 的 就 是 证 明 这 一 纳什 均衡 是 子 博 弈 精炼 的 , 即 触发 战略 必须 在 G 


so RC aw 


(oo,5) 的 每 一 个 子 博弈 中 构成 纳 计 均衡 。 我 们 已 讲 过 , G(ce,8) 的 每 一 个 
FSB SF Geco,3) 本 身 。 在 触发 战略 纳什 均衡 中 , 这 些 子 博 弈 可 分 
为 两 类 (i) 所 有 前 面 阶段 的 结果 都 是 (41,…, a ) 时 的 子 博 弈 ;和 ii) 前 面 
至 少 有 一 个 阶段 的 结果 偏离 了 (as …，,am) 时 的 子 博 弈 。 奶 果 参 与 者 在 整 
个 博 计 中 采用 了 租 发 战略 , 则 (i) 参 与 者 在 第 一 类 子 博 弈 中 的 战略 同样 也 是 
MARS, 而 我 们 刚刚 证 明 它 是 整个 博弈 的 纳什 均 枉 ;( 训 参与 者 在 第 二 类 
- 子 博弈 中 的 哉 略 永远 是 简单 重复 阶段 博弈 均衡 (csi, -… an) TERET 
博弈 的 一 个 纳什 均衡 。 从 而 ,我们 证 明了 无 限 重 复 博 蛮 的 触发 战略 纳什 均 
EF OR 


2.3.C 十 诺 双 头 垄 断 下 的 共 谋 


弗 里 德 曼 (1971) 首 先 证 明了 在 无 限 重复 博弈 中 ,采取 触发 战略 , 只 要 发 
生 任何 缘 离 ,就 在 以 后 阶段 永远 转 到 阶段 博弈 的 纳什 均衡 , 由 此 可 以 达成 在 
整个 博弈 中 的 合作 。 最 初 使 用 的 例子 是 古 诺 双 头 垄 断 时 的 共 谋 , 介绍 如 下 。 

首先 回顾 第 1.2.A 节 讲 过 的 静态 十 诺 博 蛮 :如果 市 场 中 的 总 产量 为 Q 
= qi+ gs, 则 市 场 出 清 价 格 为 P(Q) = a - Q ,假定 Q<a。 每 一 企业 的 边 
际 成 本 为 co BERERE, 两 企业 同时 移 择 产量 。 在 唯一 的 纳什 均衡 条 件 
下 ,每 一 企业 的 产量 为 (a - c)/3, 我 们 称 之 为 古 诺 产量 并 用 9. 表示 。 由 于 
均衡 条 件 下 的 总 产量 2(a - c)/3 大 于 垄断 产量 gw 二 (a - c)/2, 如 果 两 企 
业 分 别 生产 但 断 产 出 的 一 半 , 即 g; = ga/2 时 , 每 一 企业 的 福利 都 将 较 均衡 
情况 下 提高 。 

考虑 以 上 述 古 诺 博 弈 为 阶段 博弈 的 无 限 重 复 博弈 ,两 企 业 的 贴现 因子 
均 为 8。 下 面 我 们 计算 两 个 企业 的 下 述 肚 发 战略 成 为 无 限 重复 博弈 的 纳什 
均衡 时 ,贴现 因 于 3 的 值 ， 

在 第 一 阶段 生产 芍 断 产量 的 一 半 , ge/2。 第 + 阶段 ,如 果 前 面 : - 

1 个 阶段 两 个 企业 的 产量 都 为 9/2, 则 生产 9-/2; 否 则 , 生产 古 诺 产 

R geo 
由 于 在 前 一 节 的 办 徒 困境 中 已 进行 过 相似 的 证 明 , 这 里 我 们 只 给 出 论证 过 
程 的 要 点 。 

当 双方 都 生产 wm/2 时 , 每 个 企业 的 利润 为 (a - c)z/8, 我 们 用 rn/2 来 
表示 。 当 双方 都 生产 q 时 ,每 个 企业 的 利润 为 (e — c)2/9, 我 们 x, 用 表示 。 
最 后 ,如 果 企 业 i 将 在 本 期 生产 g,,/2, 则 使 企业 ; 本 期 利润 最 大 化 的 产量 
”是 下 式 的 解 


B2R PLES 8I 


maxta — q; — 1, —c)q;. 
PA + 2 hE 1 


它 的 解 为 ¢;=3Ca -<)/8, 相 应 的 利润 水 平 为 9(a - ¢)7/64, 我 们 用 xs Æ 
Tid 表示 偏离 )。 那 么 ,要 使 两 企业 采取 上 述 触 发 战略 成 为 纳什 均衡 , 必须 
满足 

1 


1-3 Sam Te me (2.3.2) 


此 式 和 分 析 因 徒 困 境 时 的 (2.3.1) 式 是 相似 的 。 将 nang 的 值 带 入 
《2.3.2) 可 得 85 宇 9/17。 由 于 与 前 一 节 相 辣 的 原因 ,这 一 纳什 均衡 又 是 子 博 
弈 精炼 的 。 

我 们 可 以 进一步 追加 如果 89/17, 企业 的 行为 将 如 何 。 我 们 将 试 着 
运用 上 一 节 讲 过 的 两 种 方法 。 首 先 来 计算 对 任意 一 个 给 定 的 仿 值 ,如 果 双 
方 都 采用 触发 战略 , 一 旦 出 现 背 高 就 永远 转 到 古 庶 产 出 , 企业 可 以 达到 的 利 
询 最 大 化 的 产量 。 我 们 已 经 知道 ,这 样 的 触发 战略 不 能 支持 低 到 董 断 产 出 
一 半 的 产量 ,但 对 任意 3 的 值 ,永远 简单 重复 古 诺 产量 却 都 是 一 个 子 博 蛮 
精炼 纳什 均衡 。 从 而 , 触发 战略 可 以 支持 芍 利 渔 最 大 化 产量 处 于 gq/2 和 
q 之 间 。 为 计算 这 一 产量 , SRR Hee. 

第 一 阶段 生产 g* 。 在 第 1 阶段, 如果 在 此 之 前 的 :1 个 院 段 两 
企业 的 产量 都 是 q", EF g " ;否则 ,生产 十 诺 产 出 geo 

如 果 双 方 都 生产 9 ,每 个 企业 的 利润 为 (a 一 29” 一 co* ,我 们 用 x* 
表示 。 和 如果 企业 i 计划 在 当期 生产 yg* , 则 使 企业 j 当期 收益 (利润 ) 最 大 化 
的 产量 为 下 式 的 解 ; 

max( a —q" —c)q;- 
其 解 为 9,=(a- q" 一 c)/2, 相应 的 利润 为 (a - g* 一 0c)214, RNG xa 
表示 。 当 下 式 成 立时 , 两 个 企业 都 采取 上 面 绍 出 的 触发 战略 为 纳什 均 交 
ln 
1-5 FM 1g Re: 
解 由 此 式 形成 的 关于 g" 的 二 次 方程 , 可 得 令 上 面 给 出 的 触发 战略 成 为 子 
博弈 精炼 纳什 均衡 的 9 
._ 9-58 
q =z gt -e), 
Cha & 单调 递减 , 4 s 达到 9/17 时 ,达到 g/2, 24 3 达到 O 时 达到 go 


下 面 我 们 斌 着 使 用 第 二 种 方法 , 它 的 出 发 点 是 威胁 使 用 最 严厉 的 可 信 
的 惩罚 。 阿 布 勒 (1986) 将 这 一 思路 运用 于 十 诺 模型 中 , 比 我 们 使 用 一 个 任 
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意 的 贴现 因子 更 具有 一 般 性 ;这 里 只 简单 证 明 在 我 们 的 模型 中 ,如果 用 阿布 
勒 的 方法 , 在 8 = 1/2( 小 于 gq/17) 时 ,也 可 以 达到 堆 断 产量 。 考 虚 下 面 的 
“Pa Tl” (two-phase) (IN FRAAS b DUKE (carrot-and-stick) ) 战 略 ， 

ZEB AE SP A #, gq /2. Bie 阶段 , 如 果 两 个 企 

业 在 第 :一 1 阶段 都 生产 gq,/2, 则 生产 g,./2; RAT EME 2-1 Bt 

器 的 产量 都 是 r, WEF gq, /2; 其 他 情况 下 生产 zo 
这 一 战略 为 参与 者 提供 了 两 种 手段 ;其 一 是 ( 单 阶段 的 ) 匹 罚 ,这 时 企业 生产 
zx; 其 二 是 {潜在 无 限 阶段 的 ) 合 作 , 这 时 企业 的 产量 为 gey2。 如 果 任 何 一 
个 企业 偏离 了 合作 , WUBI Re, 如果 任 何 一 个 企业 背离 了 翻 芒 , 则 会 使 博 
弈 进入 又 一 办 惩罚 。 如 昌 两 个 企业 都 不 背离 息 罚 , 则 在 下 一 阶段 又 回 到 合 
作 。 

如 果 两 企业 都 生产 zc, 每 个 企业 的 利润 为 (a -2z 一 <c)x, 我 们 用 riz) 
表示 。 令 Vtz) 表 示 当 期 的 利润 为 n(x), 以 后 每 阶段 的 利润 永远 是 获 断 利 
润 的 一 半 , 企业 总 收益 的 现 值 : 

a 1 


加 (一 十 IS 2™m- 
邵 困 企业 i 计划 在 当期 生产 zz, 则 使 企业 j 利润 最 大 化 的 产 出 为 下 式 的 解 


max(a — gq- 2 -—¢)q; - 
i 


其 解 为 q,=Ca-—2—c)/2, AR a ~ a- e), R xg, Ca 
示 , 其 中 dp HSE LEME HRS. | 
如 果 两 家 企业 都 采用 上 面 的 两 面 战略 , 则 无 很 重复 博弈 里 的 子 博弈 就 

WE APR.) PER Te, 其 前 面 一 个 阶段 的 结果 是 (9,/2, ae /2) 
ir, +);( 让 和 抱 罚 的 子 博弈 ,其 前 面 一 个 阶段 的 结果 既 非 (9,/2, qm/2), 叉 不 
lr, r)o 两 企业 都 采取 上 面 的 两 面 战略 要 成 为 一 个 子 博弈 精炼 纳什 均 
i, 则 在 其 每 一 类 子 博 蛮 中 遵 短 该 战略 必须 是 纳什 均衡 。 具 体 地 说 , 在 合作 
的 子 博弈 中 , 每 一 企业 与 本 期 得 到 2, 的 收益 , BFS ART RK 
Vic AM, 必须 更 愿意 永 氨 得 到 垄断 收益 的 一 半 : 

Tog pte + V(x) . (2.3.3) 
在 惩罚 的 子 博弈 中 , 每 一 企业 与 本 期 得 到 ru 的 收益 , 且 下 期 又 开始 惩罚 相 
比 ,企业 更 愿意 共同 执行 悉 罚 产量 ; 

Vr) tT + Vis) . (2.3.4) 
H Vis AKA (2.3.3) 018 
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1 1 
OC yam —a(2)} nta 2 Nm - 


ERA, 在 本 期 背离 所 得 的 好 处 必须 不 大 于 下 一 期 瑟 饲 带 来 损失 的 现 值 ( 假 
设 两 个 企业 都 不 背离 悉 罚 期 , 则 下 一 阶段 之 后 就 没有 损失 了 ,因为 秆 神 已 经 
结束 , 企业 又 回 到 垄断 产 出 ,就 像 根本 没 发 生 过 背 高 一 梯 )。 同 样 , (2.3.4) 
又 可 写成 


alian -T(r np tr) rir), 


其 含义 与 圭 面 是 相似 的 。 对 S= 1/2, 如果 zfa 一 c) 不 在 1/8 到 3/8 2), 
{2,3.,3) 式 即 可 满足 , 并 日 如 果 z/(a — © ALF 3/10 到 1/2 ZI, (2.3.4) 
式 亦 可 满足 。 从 而 ,对 = 1/2 可 达到 垄断 产 出 的 两 面 战 略 成 为 子 博弈 精 
Si AAS BY FR APE 3/8<S x /(a — ¢)S1/2. 

HES, EA SL Ah BY A eR, 内 容 比 这 里 介绍 的 简单 模型 
更 加 深入 和 丰富 。 在 本 节 最 后 , 我们 简要 讨论 这 些 模型 中 的 两 类 ;状态 变量 
{state-variable) 模 型 和 不 完美 监督 (imperfect-monitoring) 模 型 。 两 类 模型 除 
塞 头 垄 断 之 外 还 有 许 包 应 用 ,例如 ,下 一 节 介 绍 的 效率 工资 模 者 便 是 不 完 匡 
监督 的 一 个 例子 。 

罗 滕 贝 格 和 萨 隆 纳 {Rotemberg & Saloner, 1986 及 习题 2.14) 通 过 允许 
需求 函数 的 截 距 在 不 同 阶 段 随 机 波动 , 研究 了 存在 商业 周期 时 的 串 谋 。 在 
每 一 阶段 ,所 有 企业 在 选择 该 阶段 的 行动 之 前 都 可 观测 到 那 一 阶段 需求 函 
数 的 截 焉 ;在 另外 的 应 用 中 ,参与 者 在 每 一 阶段 的 开始 可 以 观测 到 另 一 个 状 
态 变 量 的 值 。 这 种 情 次 下 ,背离 一 个 给 定 战略 的 动机 不 仅 依 赖 于 当期 的 需 
求 值 ,还 决定 于 将 来 阶 眉 可 能 的 需求 。( 罗 腾 贝 格 和 萨 隆 纳 假定 需求 在 各 阶 
段 是 独立 的 ,这 样 对 后 面 的 考虑 与 当期 的 需求 值 也 古 独 立 的 ,但 其 后 的 研究 
放松 了 这 一 假定 。) 

Aa AK ALBEE (Green & Porter, 1984) 研 究 了 在 背离 无 法 完美 地 被 观测 时 
的 共 谋 :企业 不 再 能 观测 到 另外 企业 的 产 出 选择 ,每 个 企业 只 能 观测 到 市 场 
出 清 价格 , 而 这 一 价格 在 每 一 阶段 又 会 受到 无 法 观测 的 因素 的 冲击 。 在 这 
PED a PEE, 企业 无 法 分 辨 市 场 出 清 价 格 的 降低 是 由 于 另外 企业 背离 形成 
的 ,还 是 其 他 不 利 因 束 的 冲击 带 来 的 。 格 林 和 波 特 检验 了 和 触发 价格 均衡 , 其 
中 ,任何 低 于 触发 水 平 的 价格 都 会 引发 一 个 惫 罚 阶段 ,在 惩罚 阶段 所 有 企业 
都 侈 择 古 谱 产 出 。 在 均衡 条 件 下 ,没有 企业 会 表 离 。 然 而 ,市 场 因 素 一 次 严 
重 的 不 利 冲击 也 会 使 价格 降 至 甬 发 点 之 下 , 从 而 引发 一 个 惩罚 阶段 ,由 于 秆 
罚 是 由 偶然 因素 引发 的 ,本 节 所 分 析 的 甬 发 战略 里 巧 罚 将 无 限 地 持续 下 去 
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的 司法 就 不 再 是 最 优 的 , 而 由 阿布 勒 分 析 的 两 面 战 略 更 为 合理 , 事实 上 , 阿 
布 勤 .皮尔 斯 各 斯 泰 切 提 ({Pearce & Stacchetti, 1986) 证 明了 它们 可 以 成 为 
最 优选 择 。 


2.3.D 效率 工资 


在 效率 工资 的 灿 型 中 ,一 个 企业 劳动 力 的 产 出 决定 于 企业 支付 的 工资 
水 平 。 在 发 展 中 国家 的 环境 中 ,更 高 的 工资 收入 可 提供 更 好 的 营养 ;在 发 达 
国家 ,更 高 的 工资 收入 可 圾 引 更 儿 有 能 力 的 工人 到 企业 求职 ,或 者 可 以 激励 
现 有 工人 更 加 努力 工作 。 

夏 皮 罗 和 施 蒂 格 里 茨 (1984) 就 此 建立 了 一 个 动态 模型 , 其 中 企业 为 激 
励 工 人 努力 工作 ,一 方面 支付 很 高 的 薪水 ;同时 又 威胁 一 旦 被 发 现 恰 籁 , 立 
即 开 除 。 作 为 这 种 高 薪 的 一 个 后 果 , 企业 减 少 了 对 劳动 力 的 规 求 ,造成 部 分 
工人 的 高 薪 就 业 , 但 其 他 工人 ( 非 自愿 ) 失 业 并 罕 。 失 业 工 人 的 人 数 越 多 ,一 
个 被 解雇 的 工人 寻找 新 的 工作 岗位 所 需 时 间 越 长 , 于 是 解雇 的 威胁 就 更 加 
BM. RPMI, 工资 水 平 w 和 失业 率 & 恰好 可 以 使 工人 不 去 偷 
M, 并且 企业 在 工资 水 平 w 时 的 劳动 需求 恰好 俩 失业 率 等 于 xz。 我 们 分 析 
一 个 企业 和 一 个 工人 的 情况 ,从 重复 博弈 的 角度 研究 这 一 模型 ( 商 丰 考虑 其 
竞争 均衡 的 特点 )。 

考虑 如 下 的 阶段 博弈 :第 一 ,企业 对 工人 开 出 一 个 工资 水 平 ws; Bm, 
工大 接受 或 拒绝 企业 的 开价 。 如 果 工 人 拒绝 了 w, WARS HREM 
者 ,工资 水 平 为 wo 如果 工 人 接受 了 志 , 则 工人 人 选择 是 努力 工作 (会 带 米 
的 负 效 用 ) 还 是 偷懒 (不 会 带 来 任何 负 效 用 )。 工 人 对 努力 程度 的 决策 企业 
无 法 观测 , 但 企业 和 工人 都 可 观测 到 工人 的 产 出 水 平 。 产 出 可 能 高 也 可 能 
低 , 为 简单 起 见 , 我 们 认为 低 水 平 的 产 出 为 0, 高 水 平 的 产 出 为 y> 假设 
如 果 工 人 努力 工作 则 肯定 可 以 得 色 高 产 出 , 但 如 果 工 人 伦 懒 则 以 p A 
得 到 高 产 出 ,1 p 的 概率 得 到 低产 出 。 从 而 , 在 此 模型 中 ,低产 出 是 偷懒 无 
THREE. 

假设 企业 以 w 的 工资 雇 必 了 工人 ,那么 如 果 工 人 努力 工作 , 带 来 高 产 
出 时 参与 人 的 收益 分 别 为 :企业 ?了 =- we, TA we 如 果 工 人 偷情 . 则 e Æ 
为 6; 如 时 出 现 低产 出 , 则 yy BHO, RHE y- e> w> py, 从 而 对 工人 
来 讲 , 受 亡 于 企业 并 且 努 力 工 作 是 有 效率 的 ,工人 自我 雇佣 要 优 于 受 雇 于 企 
业 并 榆 司 。 

这 一 阶段 博弈 的 子 博弈 精炼 解 是 使 人 失望 的 :因为 企业 先 付 给 工人 人 工 
E w, 工 人 没有 动机 去 努力 工作 ,于 是 企业 将 开 出 w = 0{ 或 任何 其 他 的 w 
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<w, EEA HH RRA. Bit, ERRER H+, 企业 通过 给 工人 高 
于 w 的 工资 水 平 w HARB EBENAN, 就 将 工人 人 开除, BATE 
励 工人 努力 工作 的 。 下 面 我 们 证 明 在 某 些 取 值 范围 内 , 企业 给 出 较 高 的 工 
资 并 异 此 激励 工人 努力 工作 是 和 值得 的 。 

我 们 也 许 会 想 , 为 什么 企业 和 工大 不 能 签订 一 个 依据 产 出 水 平 的 补偿 
Be, 从 而 激励 工人 努力 工作 。 这 样 的 合同 也 许 不 合适 , 原因 之 一 是 法 院 要 
执行 这 样 的 合约 将 十 分 转 难 ,也 许 因 为 对 产 出 合适 的 计量 方法 包含 了 产 出 
的 质量 .生产 条 件 方 面 巴 想不到 的 困难 等 等 。 更 为 一 般 地 讲 , 依赖 于 产量 的 
合约 总 不 会 是 完美 的 {并 不 基 完 全 不 可 行 ), 但 对 这 里 我 们 研究 重复 博弈 中 
的 激励 仍 有 一 定 作 用 。 

考虑 无 限 重复 博弈 中 下 面 的 战略 , 其 中 包含 了 将 在 以 后 决定 的 w" > 
woo 如果 所 有 前 面 的 工资 开价 都 是 w* ,所 有 的 开价 都 被 接受 了 ,并 且 所 
有 前 期 的 产 出 都 是 高 的 , 我 们 就 称 博 弈 的 过 程 是 “高 工资 .高 产 出 "”。 企 业 的 
战略 为 第 一 阶 假 开 出 工资 水 平 w = ww", 并且 在 其 后 的 每 一 阶段 , 如果 博弈 
的 过 程 是 高 工资 高 产 出 , 则 继续 开 出 工资 水 平 局 ;但 其 他 情况 下 开 出 w 
=0。 工 人 的 战略 为 如 果 wl wo, 则 接受 企业 的 工资 (否则 ,选择 自我 雇 
M, 并 且 如 果 博 弈 的 过 程 (包括 本 阶段 的 工资 ) 是 高 工资 、 高 产 出 , 则 努力 工 
作 ( 否 则 偷懒 )。 
博弈 中 都 相互 合作 就 继续 合作 , 但 一 旦 有 一 次 合作 被 打破 ,就 水 远 转向 阶段 
铺 弈 的 子 铺 讲 精 炼 解 。 工 人 的 战略 也 类 似 于 这 样 的 触发 战略 ,但 由 于 工人 入 
在 序 贯 行动 的 阶段 博弈 中 的 行动 在 后 , 其 战略 也 更 加 灵活 一 些 。 在 一 个 基 
于 同时 行动 阶段 博弈 的 重复 博弈 中 , 一方 的 背离 只 能 在 某 一 阶段 结束 时 才 
可 观测 到 ;不 过 当 阶 段 博弈 是 序 叶 行动 时 , 首先 行动 方 的 背离 在 同一 阶段 就 
可 被 观测 到 {并 且 可 对 其 作出 反应 }。 工 人 的 战略 将 会 是 :如果 前 面 所 有 阶 
如 的 博弈 都 合作 则 继续 合作 ,但 如 果 企 业 一 旦 有 背离 就 选择 自己 本 阶 眉 的 
AR. BHR, 如果 ww’ ,但 wS wp 则 工人 将 接受 企业 的 工资 但 选 
ie. 

“Fi FR SD ESR aR TT aE. 
前 面 两 节 中 一 样 ,论证 由 两 部 分 组 成 ; ( 刘 导 出 双方 战略 成 为 纳什 均衡 的 条 
fF, (六 ) 证 明 它 们 是 子 博弈 精炼 的 。 

假设 企业 在 第 一 阶段 于 出 的 工资 是 w*。 给 定 企业 的 战略 , 工人 人 接受 
这 一 工资 水 平 是 最 优 的 。 如 果 工 大 努 力 工作 , 则 他 可 以 肯定 得 到 高 产 出 , 那 
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A SRA we ,而 工人 将 在 下 一 阶段 就 努力 与 否 进 行 相 
同 的 决策 。 从 而 , 如 果 对 工大 来 讲 努 为 工作 是 最 优 的 , 则 工人 收益 的 现 值 次 
V,=€w" -e) + dV, 或 V={w -e)/(1-8). 

不 过 , 如果 工人 榆 懒 , 则 工人 将 己 p 的 概率 得 到 高 产 出 ,这 时 下 一 阶段 他 还 
可 以 就 努力 与 否 进行 块 策 ; 但 工人 还 将 以 1- 疡 的 概率 得 到 低产 出 , 这 时 企 
业 和 将 在 以 后 永远 开 出 工资 we = 0, TELAI kT AARAM. Mm, 

如 果 对 工人 来 讲 偷懒 是 最 优 的 , 虽 工人 收益 的 现 值 5( 期 望 值 ) 为 


V =w” +éipV,+(— p) 
或 
V,=[C1- rw + 81 - pg 1/1 - 6,91 ~ 8) - 

对 工人 来 讲 , WR V, > V,, 选择 努力 工作 是 最 优 的 , 即 

w Swot Ge = wot (Lt aa ye ， (2.3.5) 
于 是 , 为 激励 工人 努力 工作 ,企业 必须 向 工人 支付 的 ,不 仅 足 以 补 杰 工人 自 
我 雇 必 时 的 机 会 收入 以 及 努力 工作 带 来 的 负 效 用 wo + e, 还 包含 工资 升水 
{1 一 8)e/8(1 一 也 )。 很 自然 地 , 如果 p 接近 于 1( 妈 如果 愉 懒 很 难 被 发 现 )， 
则 工资 升水 必须 非常 高 才 可 以 激励 工人 努力 工作 。 另 一 方面 , 如果 p=0, 
则 在 下 式 成 立时 ,工人 努力 工作 是 最 优 的 


Tw -Pw + ， (2.3.6) 


上 式 的 导出 与 前 两 节 关 于 完美 监督 的 分 析 中 (2.3.1) 和 (2.3.2) 相 似 , 而 
(2.3.6) 又 可 以 化 为 下 式 ; 


”十 《1 十 


它 的 确 是 (2.3.5) 中 p=0 时 的 祖 况 。 
即使 (2.3.5) 成 立 , 从 而 令 工人 的 战略 为 其 对 企业 战略 的 最 优 反 应 ,还 
BBR EW Sw" BAM. SELLA RMS, 企业 在 第 一 阶段 的 问 
Bw AR LL FEE: (Ott w= it” ,并 通过 威胁 工人 一 旦 出 现 低 
产 出 就 将 其 开除 来 激励 工人 努力 工作 , 这样 每 一 阶段 都 可 得 到 y - w "的 站 
益 ; 和 和 (2) 支付 wm =0, ETARE AREMA, 自己 在 每 一 阶段 的 收益 均 为 
010。 于是 ,企业 战略 成 为 工人 战 酷 最 优 反 应 的 条 件 为 
yow "Oo. (2.3.7) 
前 面 我 们 已 假定 y~ e> wo( 即 对 工人 而 言 , 选择 受 雇 于 企业 并 努力 工作 是 
有 效率 的 )。 但 要 使 观 方 战略 成 为 子 博弈 精炼 纳什 均衡 , 我 们 还 要 求 进一步 


l-8 
8 


Je , 
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的 条 件 :(2.3.5) 和 {2.3.7) 合 并 为 
ym es Wo +a . 


对 此 , BEG BT GA HAS RI TI RE, BS SE SL EE, 贴现 因子 8 
的 值 必须 足够 大 。 

到 此 为 止 ,我 们 已 证 明 如 果 (2.3.5) 和 (2.3.7) 成 立 , 则 前 面 纵 出 的 战略 
为 纳什 均衡 。 为 证 硼 这 些 战 略 同时 又 是 子 博 弈 精炼 的 ,首先 需 定 义 原 重复 
博弈 的 子 博 弈 。 我 们 前 面 讲 过 , 在 阶段 博弈 为 同时 行动 时 ,重复 博弈 的 子 博 
弈 由 厌 重 复 博 弈 的 两 个 阶段 之 间 开 始 , 在 这 里 分 析 的 阶段 博弈 为 序 贯 行动 
HART, FP LER RZ A, BO aS eA SEL 
大 观测 到 企业 给 出 的 工资 水 平 以 后 。 给 定 参 与 者 的 战略 , 我们 可 以 把 子 博 
FRAME tT we .高产 出 之 后 的 子 博弈 ,以 及 其 他 进行 过 程 之 后 的 
子 博弈 。 我 们 已 证 明 前 一 种 博弈 进行 诗 程 下 , 参与 者 的 战略 为 纳什 均衡 , 余 
王 的 就 是 要 证 明 后 一 种 过 程 下 的 情况 :由 于 工人 将 来 不 再 会 努力 工作 , 企业 
促使 工人 选择 自我 就 业 是 最 优 的 ;由 于 企业 将 在 下 一 阶段 及 其 后 永远 支付 
工资 w=0, 工人 在 当前 阶段 也 不 会 努力 工作 ,并 只 有 在 w> w 时 才 会 接 
4 (tay Le. 

在 这 一 均衡 中 , ARRAN DELAGA-KERERB, 
则 企业 在 其 后 将 永远 给 付 工 资 w=0; MRD o= w (最 优 工 
资 }, 则 工人 和 将 水 不 再 努力 工作 , 于 是 企业 也 不 会 再 雇佣 这 个 工人 。 可 以 有 
很 多 理由 对 这 种 永远 自我 雇佣 的 合理 性 提出 疑问 。 在 我 们 单一 企业 、 单 一 
工人 的 模型 中 , 和 永远 选择 阶段 博弈 的 子 博 弈 精炼 解 相 比 ,双方 参与 者 都 会 
更 感 意 回 到 元 限 重 复 博 弈 的 高 工资 ,高产 出 均衡 去 ,这 涉及 到 第 2.3. 和 节 
介绍 过 的 重新 谈判 。 当 时 提 到 , 如 果 和 参与 者 知道 惩 凡 将 不 会 被 执行 , 则 以 这 
种 惩 贸 相 威 胁 促 成 的 合作 便 不 再 是 一 个 均衡 。 

在 存在 劳动 力 市 场 的 情况 下 , MRE RAT ISCA, 则 它 更 倾 
向 于 不 进行 重新 谈判 ,因为 和 一 个 工人 的 重新 谈判 会 使 处 于 高 工资 .高 产 出 
均衡 的 其 他 工人 (或 将 要 选择 这 一 均衡 的 工人 人) 十 分 失望 而 改变 战略 。 如 果 
存在 许 名 企业 , 问题 成 为 企业 ; RESALE: SRILA. E 
理 的 结果 可 能 是 “ 否 ”, 因为 它 担心 会 使 现 有 高 工资 . 商 产 出 的 工人 失望 , 正 
如 一 个 企业 的 情况 一 样 。 诸 如 此 类 的 原因 可 以 解释 为 什么 日 本 大 企业 间 白 
领 男 性 的 成 年 雇员 献 乏 流动 性 。 

换 一 种 情况 , 如果 被 解雇 的 工人 总 可 以 找到 比 自我 和 雇佣 更 喜欢 的 工作 ， 
则 这 时 那些 新 工作 的 工资 ( 减 去 努力 带 来 的 负 效 用 } 就 起 到 了 自我 雇佣 收入 
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wo 的 作用 。 在 一 个 被 解雇 工人 根本 不 会 受到 任何 损失 的 极端 情况 下 ,在 
无 限 重复 博弈 中 无 法 提供 对 偷 籁 有 效 的 惩罚 ,从 而 也 不 存在 二 人 将 努力 工 
THT BRERA. BRM RK (Bulow & Rogoff, 1989) 就 
同一 思路 提供 的 一 个 关于 国家 债务 的 精致 的 例子 :如 果 一 个 债务 国 能 够 在 
国际 资本 市 场 上 通过 预先 收藏 的 短期 交易 重复 从 债权 国 借 人 长 期 贷款 , 则 
在 无 限 重 复 博 弈 中 对 依 务 国 和 债权 国之 同 的 违约 行为 就 没有 一 个 可 行 的 您 
罚 方案 。 


2.3.E£ 讨 疝 一 致 性 的 (Time-Consistenb 货币 政策 


考虑 如 下 序 贯 行动 博弈 ,其 中 雇主 和 工人 就 名 义工 资 进行 谈判 ,之 后 货 
币 当 局 选择 货币 供给 , 货币 供给 量 又 决定 了 通货 膨胀 率 。 如 果 工 资 合 同 无 
法 完美 地 指数 化 ,雇主 和 工大 在 天 定 工 资 时 都 将 尽力 去 预测 通货 膨胀 的 因 
素 。 不 过 , 一 个 不 完美 措 数 化 的 和 名 闵 工 资 一 旦 设 定 ,真实 的 通货 膨胀 率 如 高 
于 笑 测 的 通货 脱 胀 率 , 将 会 使 工人 宰 际 收入 下 降 ,导致 雇主 扩大 雇 杀 人数 ， 
扩张 生产 。 这 样 货 币 当 局 也 要 就 通货 及 胀 成 本 和 意料 之 外 的 通货 膨胀 使 失 
业 率 隆 低 及 总 产 出 提高 之 间 进 行 权 衡 ( 即 高 于 预测 水 平 之 上 的 通货 膨胀 )。 

我 们 用 下 面 的 阶段 博弈 来 分 析 这 一 问题 的 简化 形式 , Se eS 
(Barro & Gordon, 1983)。 首 先 , 雇主 形成 一 个 对 通货 陪 胀 的 预期 值 x: ;第 
二 , 货币 当局 观测 到 这 一 预期 并 选择 真实 的 通货 膨胀 率 +。 雇主 的 收益 为 
-{x 一 zx。 即 雇 主 总 是 简单 地 试图 正确 预测 通货 膨胀 率 ,在 x = x 时 他 
们 达到 收益 最 大 化 5 最 大 化 收益 为 0)。 货 币 当 局 从 自身 目标 出 发 ,希望 通 
货 膨 贝 率 为 0, 但 产 出 (4y) 能 达到 有 效率 的 水 平 (y”)。 我 们 可 以 把 货币 当 
局 的 收益 用 下 式 表 示 : 

U(x,y)= 一 cry 一 3 和 ， 
其 中 的 参数 c >0 代表 了 货币 当局 在 两 个 目标 之 间 的 替代 关系 。 假 设 真实 
产 出 可 表示 为 如 下 的 目标 产 出 和 党 料 外 通货 膨胀 的 函数 : 
y=by td(r- x), 
HP, 6<1 反映 了 产品 市 场 上 获 断 力量 的 存在 (从 而 如 果 没 有 意料 外 的 通 
贷 脱 胀 则 真实 产 出 小 于 有 效率 的 产 出 水 平 ), Bd >0 表示 意料 外 通货 脱 账 
通过 真实 工资 对 产 出 的 作用 ,正如 前 面 一 段 已 又 提 色 的 。 由 此 我 们 可 以 将 
货币 当局 的 收益 重新 表示 为 
Wir, n) =- er’ -[lb-1)y tdir n). 

为 解 出 这 一 阶段 博弈 的 子 捕 弈 精炼 解 , 首先 我 们 计算 对 给 定 的 和 雇主 期 

SR BARBS r, ASE. S Wix, x*) 最 大 化 可 得 
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n(x) =F by" + dnt]. (2.3.8) 
由 于 雇主 们 预测 到 货币 当局 将 选择 r*a), ERS RE r, iE- 
[x' (x) 一 x*]? 最 大 化 ,得 到 x' Ca) = oe 
w= 2-4). =H, , 


c 

其 中 a 的 肢 标 s (RT “Br BE" (stage game). Wie, 我 们 可 以 等 价 地 
说 ,雇主 持 有 的 理性 期 望 值 为 将 在 随后 被 货币 当局 所 确认 证 实 的 通货 膨胀 
水 平 ,因为 和 (re) =a MRA =o, SBE AHI x = nr, 
时 ,货币 当局 设 定 的 r BF r, 的 边际 成 本 刚好 抵消 掉 意 料 外 通货 膨胀 的 
边际 利益 。 在 这 一 子 博弈 精炼 解 中 ,货币 当局 被 预测 到 要 实施 遂 货 膨胀 , 并 
且 事 实 上 也 是 如 此 ,但 如 果 它 能 承诺 不 实行 通货 说 胀 政策 就 可 提高 其 福利 
水 平 。 事 实 上 , 邵 果 究 主 们 持 有 理性 预期 ( 即 x = r), PARERE 
币 当局 的 收益 达到 最 大 ( 即 当 x =x 时, Wir, x) = — cr? - (6-1)? *?, 
这 时 x =0 是 最 优 的 )。 

现在 考虑 双方 参与 者 的 贴现 因子 都 为 省 时 无 限 重复 博弈 的 情况 。 我 
们 将 导出 双方 的 下 述 战 略 成 为 子 博弈 精炼 纳 计 均衡 的 条 件 , 从 而 使 每 一 阶 
B r = =0。 在 第 一 阶段 , 息 主 们 持 有 预期 r =0, 在 其 后 各 阶段 , MEM 
BU RAGS BR 六 都 为 0 并 且 所 有 前 期 的 真实 通货 膨胀 率 x 也 都 为 0, 虽 持 
有 预期 x =0, 否则 ,雇主 持 有 预期 wt = x 一 一 从 阶段 博弈 导出 的 理性 预 
HH. AAD, 在 当期 预期 x* =0 并 且 所 有 以 前 的 预期 x* 都 为 0, 且 所 有 以 
前 的 真实 通货 冉 胀 率 x MA OR, RDS RES x =0 的 货币 供给 ; 否 
则 ,货币 当局 设 定 aa fn) 一 一 对 雇主 期 望 值 的 最 优 反 应 ,正如 (2.3.8) 
BER o 

BEEE Pr BHA EREM x* =0。 给 定 雇主 们 
的 战略 ( 即 在 雇主 们 观测 公 真 实 的 通货 脱 胀 水 平 之 后 对 其 预期 的 调整 方 
式 ), 货币 当局 可 以 上 只 和 集中 考虑 对 如 下 两 个 方案 的 选择 : (1)x =0, 它 将 
使 下 一 阶段 的 x* = 0, 从 而 使 货币 当局 在 下 一 阶段 功 可 面临 同样 的 选 
择 ; 及 (2) 从 (2.3.8) 式 计算 得 出 的 阶段 最 优选 择 x = x "(0), 它 将 舍得 
此 后 所 有 的 t= oo, 这 种 情况 下 货币 当局 特 发 现 此 后 水 远 选 择 x = x 
也 是 最 优 的 。 在 本 期 选择 x =0 可 使 得 每 一 期 的 收益 均 为 WC(0,0), 而 
在 本 期 选择 x 一 x"(0) 可 使 本 期 的 收益 为 Wr" (0),0), 但 其 后 每 期 
的 收益 永 近 为 Wa, wo Al, 4 PRR, 货币 当局 的 战略 是 雇 
主 调整 方式 的 最 优 反 应 ; 
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é 
oo on) . {2.3.9} 


TwW(0,0)> W(r (0),0) + 


此 式 与 (2.3.6) 是 类 似 的 。. 

通过 对 (2.3.9) 的 简化 可 得 8 汪 c/(2c + d*)。 人 参数 c Md 都 起 到 两 方 
面 航 效果。 例如 ,在 d 增 太 时 ,可 使 意料 之 外 的 通货 胶版 对 产 出 影响 的 效 
果 增 大 ,但 同样 的 原因 a 的 增 大 又 使 得 阶 眉 博弈 的 解 = 增 大 ,后 者 又 增 大 
了 惩罚 对 货币 当局 的 效果 。 类 似 好 ,ec 的 增 大 使 得 通货 及 胀 更 为 痛苦 。 失 
而 使 意料 外 通货 膨胀 吸引 为 减 小 ,但 同时 叉 使 m 下降。 在 两 种 情况 下 ,后 
一 作用 都 超过 了 前 一 影响 , 因而 贴现 因子 的 临界 值 也 必须 支持 这 一 均衡 : 
crf2c+d2) 随 da 的 增 大 而 递减 , 随 c 而 递增 。 

至 此 , 我 们 已 证 明了 如 果 (2.3.9) 式 成 立 , 货币 当局 的 战略 是 雇主 战略 
-的 最 优 反应 。 要 证 明 这 一 组 战略 是 纳什 均衡 , 还 须 证 明 后 者 是 前 者 的 最 优 
ER. RATTLER, 根据 这 一 战略 ,雇主 们 每 一 期 都 可 得 到 其 最 优 的 可 能 
收益 ( 即 为 6), 因 此 雇主 的 战略 是 最 优 战 略 。 证 明 这 一 组 战略 是 子 博 弈 精 
炼 的 程序 与 上 一 节 相 似 。 


2.4 完全 非 完 美 售 息 动态 人 埔 弃 


2.4.A” 博 蛮 的 扩展 式 表述 


在 第 1 SRS A BER ART TT A, 这 里 我 们 引入 
博弈 的 扩展 式 表 述 并 用 它 分 析 动 态 博 弈 . 这 一 解释 方法 可 能 会 给 人 一 个 
印象 , 那 就 是 静态 博弈 一 定 要 用 标准 式 表 述 , 动态 博弈 一 定 要 用 扩展 式 表 
述 。 但 这 是 一 种 误解 ,任何 博弈 都 既 可 以 用 标准 式 表述 ,又 可 以 用 扩展 式 玫 
述 , 尽 管 对 某 些 博弈 来 讲 , 用 其 中 一 种 表述 形式 分 析 起 来 较 另 外 一 种 要 方便 
一 些 。 我 们 将 讨论 如 何 利 用 扩展 形式 表述 一 个 静态 博弈 ,以 及 如 何 利用 标 
准 式 来 表述 一 个 动态 博弈 。 

在 第 1.1.AA 节 曾经 讲 过 ,一 个 博弈 的 标准 式 表 述 包 含 的 要 豪 有 :《1) 博 
诫 的 参与 人 ;(2) 每 一 参与 人 可 人 殿 选 择 的 战略 , 及 (3) 与 参与 者 可 能 选择 的 每 
一 战略 组 合 相对 应 的 各 个 参与 者 的 收益 。 


D ARASH Reb aE, 要 进一步 了 解 精确 的 理论 . HS TA i 
41982). 
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定义 ”一 个 博弈 的 扩展 式 表 述 包 括 :(t) 博 弈 中 的 参与 人 ;(2a) 每 一 参 
与 者 在 何 时 行动 ; (2b) 每 次 轮 到 某 一 参与 者 行动 时 , 可 供 他 选择 的 行动 ; 
《2c) 每 次 轮 到 某 一 参与 者 行动 时 , 他 所 了 解 的 信息 ;及 (3) 与 参与 者 可 能 选 
择 的 每 一 行动 组 合 相 对 应 的 各 个 参与 者 的 收益 。 


事实 上 ,在 第 2.1 到 2.3 节 我 们 已 经 分 析 过 几 个 用 扩展 式 表 述 的 博 蹇 ， 
尽管 当时 设 有 明确 这 一 季 念 。 本 节 的 主要 上 内容 是 引信 博 弈 树 描述 博 穿 的 扩 
展 式 , 而 不 是 文字 描述 ,因为 前 者 在 通常 情况 下 更 使 于 表示 利 分析。 


参与 者 1 的 收益 3 1 2 
参与 者 2 的 收益 1 2 1 


Ooo 


FR 2.4.1 


作为 博弈 扩展 式 表 述 的 一 个 例子 ,考虑 属于 第 2.1.A 节 介绍 过 的 完全 
且 完 美 信 息 两 阶段 博弈 的 一 个 具体 例子 : 

1. 参与 者 1 AUTR A = IL, R PRAT ay; 

2. BSF 2 观测 到 ai, 然后 从 可 行 集 A = IL, R + 中 选择 行动 az; 

3. 两 参与 者 的 收益 分 别 为 wifaiy az 和 usla as), 如 图 2.4.1 的 博 
弈 树 所 示 。 

这 一 博弈 树 始 于 参与 者 1 的 一 个 决策 节 (decision node), 这 时 1 BM L 
FAR 中 作出 选择 ,如 果 参 与 者 1 选择 工 , 其 后 就 到 达 参 与 者 2 的 一 个 决策 
节 , 这 时 2 要 人 只 上 “和 尺 ' 中 选择 行动 。 类 似 地 ,如果 参与 者 1 HER, 则 将 到 
达 参 与 者 2 的 另 一 个 决策 节 , 这 时 2 从 工 ' 和 R’ 中 选择 行动 。 无 论 2 选择 了 
哪 一 个 ,都 将 到 达 终 点 节 (terminal node)( 即 博弈 结束 ) 且 两 参与 者 分 别 得 
到 相应 终点 节 下 面 的 收益 。 

用 类 似 的 方法 可 将 图 2.4.1 的 博弈 树 进行 扩展 , 用 来 表示 所 有 完全 且 
完美 信息 动态 博 蛮 一 一 即 任何 参与 者 峰 闻 行动、 对 下 一 行动 作出 选择 之 前 
其 前 面 所 有 行动 都 是 共同 知识 , 并 且 每 一 可 能 的 行动 组 合 下 种 和合 与 者 的 收 
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faz CE SE Fo] A PRE. (SDT ER ESR FF oh SV) SE SA, Bh, 
鲁 宾 斯 坦 模 型 中 行动 空间 无 限 的 情况 , 只 是 给 留 形 胡 示 带 来 了 国难 ,但 从 概 
念 上 讲 却 没 有 任何 障碍 。) 此 后 我 们 将 导出 图 2.4.1 所 未 动态 博弈 的 标准 式 
表述 , 并 在 本 节 的 最 后 证 明 静 态 博 弈 也 可 以 给 出 扩展 式 表 述 ,并 介绍 如 何 榴 
建 完 全 非 完 美 信 息 动态 博弈 的 扩展 式 表述 。 

正如 在 对 标准 式 和 扩展 式 定义 中 的 序号 所 代表 的 ,标准 式 定义 中 “一 个 
参与 者 可 行 的 战略 ”第 二 条 ) 与 扩展 式 定 义 中 "一 个 参与 者 何 时 行动 .他 可 
以 如 何 行动 及 他 了 解 秆 么 信息 "(第 2a .25 和 2c 条 ), 有 着 非常 密切 的 关 
系 。 为 把 一 个 动态 博弈 表示 为 标准 式 , 我 们 需 把 扩展 式 中 的 信息 转换 为 对 
标准 式 中 每 一 参与 者 战 咯 空间 的 描述 。 为 做 到 这 一 点 , 回 帮 第 2.3.B 节 给 
出 的 “战略 ”的 ( 非 正式 ) 定 义 : 


定义 ”参与 者 的 一 个 战略 是 关于 行动 的 一 个 完整 计划 一 一 它 明确 了 在 
参与 者 可 能 会 遇 刘 的 每 一 种 情况 下 对 可 行 行动 的 选择 - 


要 求 参 与 者 的 一 个 战略 明确 该 参与 者 可 能 会 遇 到 的 每 一 种 情况 下 的 行 
动 远 择 ,看 起 来 似乎 是 不 必要 的 。 不 过 ,很 快 我 们 将 会 看 到 , 如 果 多 许 参与 
者 的 一 个 战 了 格 中 没有 明确 某 些 情 沈 下 该 参与 者 的 行动 ,我们 将 无 法 在 完全 
信息 动态 博弈 中 使 用 销 什 均衡 梳 念 。 在 参与 者 j 计算 针对 参与 者 i 的 战略 
的 最 优 反应 时 ,j 需要 考虑 在 每 一 种 情况 下 i 将 如 何 行动 , 而 并 非 仅 考 虑 在 
i 或 了 认为 最 有 可 能 发 生 的 情况 下 对 方 的 行动 。 

在 图 2.4.1 的 博弈 中 ,参与 者 2 有 两 个 行动 , 却 有 4 个 战略 ;因为 还 在 
在 着 两 种 不 同 的 情况 (具体 地 说 ,分 别 是 观测 到 参与 者 1 选择 L 和 观测 到 
参与 者 1 选择 R 后 的 情况 ), 参与 者 2 将 可 能 在 这 两 种 情况 下 进行 选择 . 

战略 1; 如果 参 与 者 1 选择 工 , 则 选择 L, 如 果 参 与 者 1 选择 R, 则 选择 

工 表示 为 (LL', LY; 

战 路 2: 媳 果 参 与 者 1 选择 工 , 则 选择 L, 如 果 参 与 者 1 选择 R, Wa 

R, ERAL, R) | 

战略 3: 如果 参与 者 工 选择 工 , 则 选择 R: 如 果 参 与 者 1 选择 R, 则 选 

FEL’, BARACR’.R’); l 

战略 4: 如 果 参 与 者 工 选择 工 , 则 选择 R', 如 果 参 与 者 1 选择 R, WK 

择 OR’, RA ACR’, R Jo . 
不 过 对 参与 者 1 来 讲 , 有 两 个 行动 但 同时 也 只 有 两 个 战略 :选择 上 和 选择 
民 。 参 与 者 1 之 所 以 只 有 两 个 战略 , 是 因为 参与 者 1 行动 时 只 有 可 能 面临 
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一 种 情况 (具体 地 说 ,就 是 在 博弈 的 一 开始 ,这 时 自然 由 参与 者 1 行动 ), 于 
是 参与 者 1 的 战略 空间 与 其 行动 空间 是 相同 的 , 即 ASIL, Rio 

给 出 两 参与 者 的 战略 空间 后 , 从 博弈 的 扩展 式 表 述 导 出 其 标准 式 表 述 
就 十 分 简单 了 。 用 标准 式 表 述 中 的 行 表示 傅 与 者 1 的 可 行 战 巾 , 列表 示 参 
与 者 2 的 可 行 战略 , 并 计算 参与 者 每 一 可 能 的 战略 组 合 下 每 人 的 收益 , 如 图 
2.4.2 所 示 。 


参与 者 2 


(L'E) (L'R (R'E) (RR) 
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现在 我 们 已 证 明 一 个 动态 博弈 可 以 表示 为 标准 式 , 下面 我 们 反 过 来 说 
明 一 个 静态 ( 即 同 时 行动 ) 博 弈 如 何 用 扩 尾 式 表 述 。 要 向 到 这 一 点 ,我 们 要 
运用 第 1.1.A 节 与 囚徒 困境 相关 的 一 个 观察 结果 ,静态 博弈 中 参与 者 不 
一 定 要 同时 行动 :每 个 参与 者 在 选择 战略 时 不 知道 其 他 参与 者 的 选择 就 
足够 了 。 正 如 因 徒 困境 中 分 开关 押 的 因 犯 可 以 在 任何 时 间作 出 他 们 的 
决策 。 从 而 我 们 可 以 把 (所 谓 的 ) 参 与 者 1 和 2 之 间 的 同时 行动 博弈 表 
示 如 下 : 

1. 参 与 者 1 从 可 行 集中 选择 行动 a1; 

2. 参 与 者 2 没有 观测 到 参与 者 1 的 行动 , 并 从 可 行 集 中 选择 行动 az: 

3. 两 参与 者 的 收益 分 别 为 ulan ez) 和 u2(a1,42)6 
或 换 一 种 顺序 ,参与 者 2 可 以 首先 行动 , 接着 参与 者 1 在 没有 观测 到 参与 者 
2 行动 的 情况 下 行动 。 回 顾 我 们 在 第 2.1.B 节 介 绍 的 斯 塔 克 尔 贝 里 博弈 ， 
企业 2 在 行动 之 前 观测 到 企业 1 的 产量 ， 当 人 时 还 所 到 一 个 与 之 时 序 完 全 相 
同 ， 担 信息 结构 却 不 同 的 情况 ， 那 里 我 们 证 明 ， 在 这 一 序 叶 行动， 并 不 能 
观测 型 其 他 参与 者 行动 的 博弈 中 ， 有 着 和 同时 行动 的 二 诺 博弈 相同 的 纳什 
均衡 。 

为 在 博弈 的 扩展 式 中 表示 此 类 不 知道 以 前 行动 的 情况 ,我们 引入 一 个 
新 的 福 愈 一 一 参与 者 的 信息 集 (information set); 


定义 ”参与 者 的 一 个 信息 集 指 满足 以 下 条 件 的 决策 节 的 集合 : 
(GD 在 此 信息 集中 的 每 一 个 节 都 轮 到 该 参与 者 行动 , 旧 
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《i 刘 当 博 弈 的 进行 达到 信息 集中 的 一 个 结 , 应 该 行动 的 参与 者 并 不 知道 
达到 了 (或 没有 达到 ) 信 息 集中 的 哪 一 个 节 。 


这 一 定义 的 第 (ii) 部 分 意味 着 参与 者 在 一 个 信息 集中 的 每 一 个 决策 节 都 有 
着 相同 的 可 行 行动 集合 ,可 则 该 参与 者 就 可 通过 他 面临 的 不 同 的 可 行 行动 
集 来 推断 到 达 了 (或 没有 到 达 ) 某 些 节 。 


Ate 1 


FA 2.4.3 


在 一 个 扩展 式 博 弈 中 , 为 表示 基 些 决策 节 处 于 同一 信息 集中 , Ae 
线 把 这 些 决 策 节 连 起 来 ,如 图 2.4.3 瘦 出 的 囚徒 困境 的 扩展 式 表 述 。 有 了 时 我 
们 在 同一 信息 集中 每 个 决策 节 旁 边 注 明 轮 到 哪 一 个 参与 者 行动 , 如 图 
2.4.3 所 示 ; 有 时 我 们 只 是 在 连接 这 些 节 的 虚线 上 注 明 轮 到 哪 一 参与 者 行 
动 ,加 图 2.4.4 所 示 。 图 2.4.3 +, Att 2 的 信息 集 表 示 在 轮 到 囚徒 2 行动 
At, th RAE BIA ik FSR MAE 1 已 经 行动 过 了 ), 但 是 并 不 清楚 到 
达 了 哪 一 个 节 ( 即 囚徒 1 是 如 何 行动 的 )。 在 第 4 章 中 我 们 将 讲 到 办 第 2 会 
对 囚徒 1 的 行动 桂 有 一 个 猪 测 或 推断 ,即使 他 并 不 能 观察 到 前 者 的 行动 ,但 
目前 我 们 暂时 不 考虑 这 一 因素 。 

作为 运用 信息 和 集 表 示 不 了 解 前 面 行动 的 第 二 个 例子 ,考虑 下 面 的 完全 
非 完 美 信 息 动 态 博弈 ; 

1. 参 与 者 上 从 可 行 集 A = |L, Ri 中 选择 行动 ais 

2 .参与 者 2 观测 到 ol, 然后 从 可 行 集 A= |L, R'! 中 选择 行动 az; 

3. 参 与 者 3 WEG anan = (R, PR’), READ A=], R" 
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中 选择 行动 a;。 


B 2.4.4 


hE RRR CA MEEL, RESA SD HH i ) on 
图 2.4.4 所 给 出 。 在 扩展 式 中 , 参与 者 3 有 两 个 信息 集 ; 如 果 1 A R, 2 
选择 R, 参与 者 3 进入 只 有 一 个 决策 节 的 信息 集 ,此 种 情况 之 外轮 到 3 行 
动 时 , 则 他 进入 包含 其 余 所 有 决策 节 的 信息 集 。 从 而 ,参与 者 3 所 能 够 观测 
到 的 只 是 (ai, a2) 是 否 等 于 (R,R’)。 | 

在 引入 了 信息 集 的 概念 之 后 , 我 们 可 以 给 出 区 分 完美 信息 和 非 完美 信 
旧 的 另外 一 种 定义 。 前 面 我 们 曾 将 完美 信息 定义 为 在 博 守 的 每 一 步行 动 
中 , 轮 到 行动 的 参与 者 了 解 前 面 博 弈 进行 的 全 部 过 程 . 对 完美 信息 的 一 个 
等 价 的 定义 是 每 一 个 信息 些 都 是 单 节 的 ;相反 , 非 完 美 信息 则 意味 着 至 
少 存 在 一 个 非 单 节 的 信息 集 2。 那 么 , 一 个 同时 行动 博弈 (如 因 徒 困境 ) 
的 扩展 式 表 述 就 是 一 个 非 完 美 信 息 博 变 。 同 理 ,第 2.2.A 节 讨论 的 两 
阶段 博弈 也 是 非 完 美 信 息 的, 因为 参与 者 1 和 2 的 行动 是 同时 的 , 参与 
者 3 和 4 的 行动 也 是 同时 的 。 更 为 一 般 地 , 一 个 完全 但 非 完美 信息 动态 
博弈 可 用 含有 非 单 节 信 息 集 的 扩展 式 表 示 , 从 而 可 以 看 出 每 一 参与 者 在 
论 到 他 行动 时 , 知道 (以 及 不 知道 ) 什 么 ,这 一 点 ,图 2.4.4 已 给 出 一 个 
例子 。 


2.4.B 于 博 讲 精炼 纳 刁 均衡 
第 2.3,.B 节 给 出 了 子 博弈 精 坟 纳 什 均衡 的 一 般 性 定义 。 但 当时 我 们 
中 ”这 种 用 是 否 单 节 信息 浴 区 分 完美 信息 和 非 完美 信息 的 方法 只 限于 完全 信息 的 博 诗 , 因为 


HA THK, 完美 但 非 完 全 信息 搏弈 的 扩展 式 旭 述 就 售 有 非 单 节 的 倍 息 集 , 不 过 , EER p, 我 
们 只 讨 座 完全 信息 的 情况 。 
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只 把 这 一 定义 用 于 重复 博弈 ,因为 我 们 只 针对 重复 博弈 定义 了 战略 和 子 博 
弈 的 概念 。 在 第 2.4.A 节 我 们 给 出 了 战略 这 一 概念 的 一 般 性 定义 ,现在 再 
给 出 子 博弈 的 一 般 性 定义 , 其 后 就 可 以 把 于 博弈 精炼 纳什 均衡 的 概念 应 用 
于 一 般 的 完全 信息 动态 博弈 了 。 

回顾 第 2.3.B 节 我 们 曾 给 出 的 子 博弈 的 非 正 式 定 义 , 即 从 博弈 进行 到 
的 某 一 点 开始 ,前面 整 个 博弈 的 进行 过 程 在 所 有 参与 者 中 都 是 共同 知识 , 始 
于 该 点 的 其 余部 分 的 博弈 就 是 原 博弈 的 一 个 于 博弈 , 并 针对 重复 博 讲 给 出 
了 子 博 蹇 的 正式 定义 。 下 面 我 们 对 用 扩展 式 表 述 的 一 般 完全 信息 动态 博 蛮 
oe Hi FSF AY IE RE X, 


定义 PRARAPHT RE 

(a) 始 于 单 节 信息 集 的 决策 节 n (但 不 包括 博弈 的 第 一 个 决策 节 ); 

Cb} 包含 博弈 树 中 n 之 下 所 有 的 决策 节 和 终点 节 ( 但 不 在 n 下 面 的 徐 
外 ); 

(Cc) 没有 对 任何 信息 集 形成 分 割 。( 妈 如 果 博 弈 树 中 之 下 有 一 个 湛 
BE no”, 则 和 ”处 于 同一 信息 集 的 其 他 决策 节 也 必须 在 * .之 下 ,从 
而 也 必须 包含 于 子 博 蛮 中 。) 


定义 中 , (a) 的 附注 说 明了 我 们 不 把 整个 博弈 看 成 一 个 子 博弈 , 但 这 只 是 一 
个 习惯 问题 :把 定义 中 的 括号 除去 对 我 们 以 后 的 分 析 不 会 产生 任何 影响 。 

我 们 可 以 利用 图 2.4.1 和 图 2.4.3 的 因 徒 困境 说 明定 义 中 的 前 两 部 分 
(a) 和 (b)。 图 2.4.1 中 ,存在 两 个 于 博弈 ,分 别 始 于 参与 者 2 的 两 个 决策 
节 。 在 四 徒 困境 (或 其 他 芷 何 同时 行动 博弈 ) 中 不 存在 子 博 弈 。 为 说 明定 义 
的 最 后 部 分 (c), 考虑 图 2.4.4 给 出 的 博弈 ,该 博弈 只 有 一 个 于 博弈 , 它 始 于 
参与 者 1 选择 尺 ,参与 者 2 选择 R' 之 后 参与 者 3 的 决策 节 。 由 于 (ce) 的 限 
制 ,参与 者 2 的 两 个 决策 节 之 下 都 不 能 构成 一 个 于 博 穿 , 即使 这 两 个 决策 节 
都 处 于 单 节 的 信息 集 。 

之 所 以 在 定义 中 要 加 上 (e) 的 限制 ,是 因为 我 们 希望 能 够 把 子 博弈 当成 
一 个 独立 的 博弈 进行 分 析 , 并 且 分 析 的 结果 能 用 于 原 博弈 。 在 图 2.4.4 中 ， 
如 果 我 们 试 着 把 参与 者 1 选择 工 之 后 参与 者 2 的 决策 节 看 成 一 个 子 博 弈 
的 起 点 ,事实 上 我 们 是 制造 了 一 个 子 博弈 ,其 中 参与 者 3 不 知道 参与 者 2 的 
行动 ,但 却 知道 参与 者 1 的 行动 。 对 这 样 一 个 子 博 弈 的 分 析 与 原 博弈 就 不 
存在 相关 性 , 因为 在 原 博 弈 中 参与 者 3 并 不 知道 1 的 行动 ,而 只 能 观测 到 
(Cai: az) 是 否 等 于 (R,R”)。 请 回顾 在 讨论 重复 博弈 时 相似 的 论证 , 即 第 * 
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fy BS AY Br Ee SF AREEN << TORSHRR ERS TF. 

AHDE A — PPB, Ea) RARE T ERR n 应 该 行动 的 参 
HAERE BA Ee ETO, 而 不 能 保证 其 他 参与 者 也 知道 这 
一 过 程 ,(c) 则 保证 了 博弈 到 该 点 为 止 的 整个 过 程 在 所 有 参与 者 中 是 共同 知 
识 , 原 困 如 下 :在 之 后 的 任何 节 , 比如 n, E 2 应 该 行动 的 参与 者 知道 博 
弈 到 达 了 决策 节 w, 从 而 即使 wn“ 寻 于 非 单 节 的 信息 集 , 由 于 在 该 信息 集中 的 
所 有 节 都 在 n 之 下 ,在 该 信息 集 行动 的 参与 者 就 知道 博弈 已 经 到 达 了 n 下 
面 的 某 个 决策 节 。( 如 果 认 为 后 面 的 叙述 有 些 描 口 ,部 分 因为 博弈 的 标准 式 
表述 只 明确 了 在 参与 者 ; 的 每 一 个 类 策 节 :i 知道 的 信息 , MHRA WR 
出 在 ij 的 决策 节 ; 知道 的 信息 。) 前 面 已 讲 过 ,图 2.4.4 就 提供 了 不 符合 (c) 
的 一 个 例子 。 现 在 ,我 站 可 以 重新 解释 这 个 枫 子 ,如 果 我 们 ( 非 正式 地 ) 分 析 
一 下 在 参与 者 1 选择 L 之 后 参与 者 2 的 决策 节 上 参与 者 3 知道 的 信息 ,就 
会 发 现 3 并 不 知道 博弈 到 该 点 为 止 的 全 部 进行 过 程 ,因为 在 其 后 3 的 决策 
节 中 ,他 并 不 知道 1 是 选择 了 上 还 是 选择 了 R。 

在 给 出 子 博 弈 的 一 般 定义 之 后 ,我 们 就 可 以 使 用 第 2.3.B 节 给 出 的 子 
博弈 精炼 纳什 均衡 的 定义 了 : 


定义 ( 塞 尔 滕 ,1965) 如果 参与 者 的 哉 略 在 每 一 个 子 博 弈 中 都 构成 了 
纳什 均衡 , 则 称 纳什 均 和 本 是 子 博 蛮 精 烽 的 。 


任何 有 限 的 完全 信息 动态 博 诸 ( 即 任何 参与 者 有 限 .每 一 参与 者 的 可 行 
战略 集 有 限 的 博弈) 都 存在 子 祖 弈 精 炬 纳什 均衡 , 也 许 包含 混合 战略 。 这 一 
结论 的 证 明 思 路 非常 简单 , 即 根 据 北向 归纳 的 原理 , 构建 出 子 博弈 精炼 纳什 
均衡 , 并 基于 下 面 两 个 观察 结论 。 第 一 ,尽管 纳什 定理 是 在 完全 信息 静态 博 
弈 的 条 件 下 给 出 的 , 它 适 用 于 任何 有 限 的 完全 信息 的 标准 式 博弈 , 并 且 我 们 
己 经 证 明 此 类 博弈 既 可 以 是 静态 的 ,又 可 以 是 动态 的 。 第 二 ,一 个 有 限 的 完 
全 信息 动态 博弈 的 子 博弈 数 也 是 有 限 的 , 而 每 个 子 博 蹇 都 满足 纳什 定理 的 
BE.P 


T AWR— TFA He, BE eS a T E 
{如果 一 个 子 博弈 不 再 包含 其 他 任何 子 博弈 , 读 子 醒 弃 就 是 最 小 的 )。 其 后 , 用 这 些 子 博弈 的 一 个 纳 
什 均衡 收益 在 原 博弈 树 中 短 换 拌 这 些 子 博 蛮 ， 并 把 这 些 于 博 穿 的 初始 节 看 成 原 博 罕 的 终点 节 。 选 
定 包含 了 简化 后 博 守 树 所 有 终点 节 的 最 小 的 于 博 栾 , 并 用 这 些 子 博弈 的 一 个 纳什 均衡 收 益 代替 这 
些 于 博弈 。 用 此 方法 从 树 的 最 末端 逆 推 就 可 得 到 一 个子 博弈 畏 烧 纳什 灼 林 , 因为 套 与 者 的 战略 在 
每 一 个 子 博 弈 中 都 构成 了 纳什 均衡 (事实 上 , 还 是 子 情 罕 炳 炼 纳什 均衡 )- 
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PRB Sr Aa ct SF AEE 8 FY Be SEY PR a: 2.1 A 
节 定 义 的 逆向 归纳 解 和 第 2.2.A 节 定 义 的 子 博 弈 精炼 解 。 不 太 正 式 地 讲 ， 
其 区 别 在 于 一 个 均衡 是 战略 的 集合 {战略 又 是 关于 行动 的 完全 的 计划 ), 而 
一 个 解 则 只 对 期 望 将 要 发 生 的 情况 给 出 相应 的 行动 及 结果 , 而 不 是 针对 所 
有 可 能 发 生 的 情况 。 要 进一步 精确 界定 “均衡 ”和 “ 解 “ 的 区 别 , 并 更 好 地 说 
明子 博弈 精炼 纳什 均衡 的 概念 ,现在 我 们 重新 考虑 第 2.1.A WA 2.2.4 
Pe LHRH. 


定义 ”在 第 2.1.A 节 定义 的 完全 且 完 美 信 息 两 阶段 博弈 中 , 逆向 归纳 
MACal, Rala )), 但 子 博 弈 精炼 纳什 均衡 为 (ar ,RR2(ta,))。 


在 这 样 的 博弈 中 ,行动 ay 即 为 参与 者 1 的 一 个 战 路 ,因为 参与 者 1 只 
可 能 在 一 种 情况 下 选择 行动 一 一 即 在 博弈 刚 开 始 , 不 过 对 参与 者 2, RR， 
(af ) 却 只 是 一 个 行动 (具体 地 说 ,是 对 a? 的 最 优 反 应 ), 而 并 非 一 个 战略 ， 
因为 参与 者 2 的 一 个 战略 必须 包含 针对 1 在 第 一 阶 仆 每 个 可 能 的 行动 , 参 
与 者 2 将 采取 的 行动 。 从 而 , 参与 者 2 的 最 优 反 应 了 消 数 Rifai) 是 其 一 个 战 
覆 。 在 此 类 博弈 中 , 子 博弈 始 于 (并 只 包 合 ) 参 与 者 2 在 第 二 阶段 的 行动 。 
对 参与 者 1 的 每 一 个 可 能 行动 a, 属于 4 ,都 存在 一 个 子 博 弈 ， 从 而 为 证 
Hilar, Rola, D B—-TPFRA MSA, Ril MEW Cal, R 
Ca1)) 是 一 个 纳什 均衡 ， 并 且 参 与 者 的 战略 在 每 一 个 于 博弈 中 都 构成 一 个 
纳什 均 衔 。 由 于 子 博弈 都 只 是 单 人 决策 问题 ， 后 一 回 题 就 可 简单 化 为 要 求 
参与 者 2 的 行动 在 每 一 子 博 弈 中 都 是 最 优 的 ， 它 又 正 是 参与 者 2 的 最 优 反 
MBM Rz(ai) 所 解决 的 问题 。 最 后 , (al. Ratei) 是 一 个 纳什 均衡 , 因为 
参与 者 的 战略 互 为 最 优 反 应 ;a “是 Ratai) 的 最 优 反 应 , 即 ar 令 wiifal 玉 2 
《ai 最 大 化 ,并 且 Ra) Aa” 的 最 优 反 应 , 即 Ral) uslaf,a.}mh 
大 化 。 、 

对 第 2,2.A 节 分 析 的 博弈 ,其 论证 过 程 是 相似 的 ,所 以 我 们 只 进行 简 
要 的 讨论 。 


定义 ”在 第 2.2,A 节 定义 的 完全 非 完 美 信 息 两 阶段 博弈 中 , TH 
WH lal, alag, lala? haa (arsa? J), ATR RRA TARA 


(af ,az,a3,laj,az J) ag (aiar ))o 


EMA P, TAG Calata haa lara )) 只 是 参与 者 3 
和 4 Et TBAT SW, (具体 地 说 , 是 参与 者 1 和 2 选 定 战略 
(ar > ) 后 其 余部 分 的 博弈 ) 而 (ay (a1, az), aa (a1, a2)) 却 分 别 为 参与 
者 3 和 参与 者 4 的 一 个 战略 一 一 针对 参与 者 1 和 2 每 一 可 能 行动 组 合作 出 
到 应 的 完整 行动 计划 。 在 这 一 博弈 中 , 子 博 弈 是 在 给 定 参 与 者 1 和 2 在 第 
一 阶段 的 行动 后 , 第 二 阶段 参与 者 3 和 4 之 间 的 博 穿 ,正如 子 博弈 精炼 纳什 
均衡 所 要 求 的 , 战略 组 合 (as lanaz ai lan a2) ER TF RAP RY 
成 了 纳什 均衡 。 

HAREE OARRA, 我们 用 下 面 的 例子 说 明 本 音 的 主要 思 
想 : 子 博弈 精炼 日 除了 基于 不 可 团 信 的 威胁 或 承诺 之 上 上 的 纳什 均衡 。 请 回 
顾 图 2.4.1+ 中 的 扩展 式 博 弈 ,如果 我 们 在 第 2.1.4A 节 轴 到 这 一 博弈 ,我 们 
就 会 用 逆向 归纳 法 求解 如 下 。 如 果 参 与 者 2 到 达 参 与 者 1 选择 工 之 后 的 
决策 节 , 则 2 的 最 优 反 应 为 选择 R“{ 可 得 到 的 收益 为 2), 而 不 是 选择 L“( 上 只 
能 得 到 1 的 收益 )。 如 果 2 到 达 参 与 者 1 RHR 之 下 的 决策 节 , 则 2 的 最 
优 反 应 为 选择 L“( 可 获得 的 收益 为 1), 而 不 是 RR“( 可 得 到 的 政 益 为 0)。 由 
于 参与 者 1 能 和 参与 者 2 一 样 解 出 2 的 最 优选 择 , 1 在 第 一 阶段 的 问题 就 
可 归结 为 在 L( 将 会 令 参 与 者 2 选择 民 ,从 而 使 1 的 收益 为 37 和 ROS 
使 参与 者 2 选择 工 ', 从 而 使 1 的 收益 为 2) 之 间 进 行 选择 。 从 而 , 参与 者 1 
对 预期 的 2 的 行动 的 最 优 反 应 是 在 第 一 阶段 选择 民 , 于 是 博弈 的 逆向 归纳 
WAR, L}, 如 在 图 2.4.5 中 用 和 粗 线 表示 出 的 始 于 参与 者 1 决策 节 的 路 
径 。 图 中 另外 还 有 一 条 粗 线 始 自 参 与 者 1 选择 工 之 后 的 参与 者 2 的 决策 
节 , 博弈 树 中 的 这 种 不 完全 路 径 表 明 , 如 果 博 弈 到 达 参 与 者 2 的 这 一 决策 
节 , 参 与 者 2 将 会 选择 R’, 

我 们 已 讲 过 , 同一 博弈 的 标准 式 表 述 由 图 2.4.2 给 和 出。 如果 我 们 在 第 


joo) Brew 


1.1. 人 C 节 中 过 到 这 么 一 个 标准 式 博 弃 ,我 们 将 会 解 出 其 ( 纯 战 略 ) 纳 什 均 衡 ， 
EAR (RL DALL, CR R'))。 下 面 我 们 来 比较 从 图 2.4.2 中 解 
出 的 这 两 个 纳什 均衡 与 图 2.4.5 中 根据 扩展 式 道 向 归纳 法 导出 的 结果 : 标 
HERE PA STR, CR, 工 )) 对 应 了 图 2.4.5 中 的 所 有 粗 线路 径 。 
在 第 2.1.A 节 我 们 称 (R, 工 ') 为 博弈 的 道 向 归纳 解 ; 因此 也 可 以 十 分 自然 
WERCR, OR’, ?为 博弈 的 逆向 归纳 纳什 均衡 ,但 我 们 用 较为 专业 性 的 名 
词 称 之 为 子 博弈 精炼 纳什 均衡 。 一 个 解 和 一 个 均衡 的 区 别 , 在 于 解 特 指 始 
于 博弈 的 第 一 个 决策 节 并 终于 终点 节 的 惟一 的 粗 线路 径 , 而 均衡 同时 还 包 
ST SAHRA 1 选择 工 之 后 2 的 决策 节 的 粗 体 线路 径 , 这 也 就 是 说 , 均 
衡 包 含 了 参与 者 2 的 一 个 完整 的 战略 。 

但 另 一 个 纳什 均衡 (R, (R’,L’)) 又 有 什么 特点 呢 ? 在 这 一 均衡 中 , 参 
与 者 2 的 战略 是 不 仅 在 参与 者 1 选择 工 时 选择 及 (这 一 条 和 第 一 个 纳什 均 
衡 是 相同 的 ), 而 且 当 参与 者 1 选择 R 时 仍 选 择 R 。 因 为 (在 民 之 后 的 ) 民 - 
将 使 参与 者 1 的 收益 为 0, 参 与 者 1 对 参与 者 2 这 一 战略 的 最 优 反 应 将 是 
选择 工 , 以 使 参与 者 1 的 收益 达到 1( 在 参与 者 2 KE R ZE), 至少 优 于 一 
无 所 获 。 用 不 太 严 格 却 更 为 形象 的 话 讲 , 我 们 可 以 说 参与 者 2 威胁 如 果 参 
与 者 1 选择 R, 他 将 选择 RT 严格 地 讲 ,在 1 选择 行动 之 前 ,2 并 没有 机 会 
作出 这 一 威 脑 , 如果 有 , 它 将 已 经 包 售 在 扩展 式 之 中 了 }。 如 果 这 一 威胁 起 
作用 了 (有 即 1 选择 了 LOW 2 RRAS SR Re, 不 过 这 一 威胁 也 不 
会 起 作用 , 因为 它 是 不 可 信 的 ;如 果 参 与 者 2 被 给 予 机 会 实施 他 的 威胁 ( 即 
如 果 1 的 确 选 择 了 R) 则 参与 者 2 将 会 决定 选择 L, 而 不 会 是 RR’. FE 
式 一 点 儿 说 , 纳 计 均衡 (IL, OR R')) 不 是 子 博弈 精炼 的 , 因为 参与 者 的 战 
路 在 其 中 的 一 个 子 博弈 中 没有 构成 纳什 均衡 。 具 体 地 说 , 参与 者 2 的 选择 
R’ 在 始 自 (并 完全 由 其 组 成 ) 参 与 者 1 选择 R 之 后 参与 者 2 的 决策 节 的 子 
博弈 中 不 是 最 优 的 。 

在 一 个 完全 且 完 美 信息 博弈 中 , DO RAO. : E 
每 一 个 信息 集 都 是 单 节 的 ,博弈 树 上 每 个 决策 节 都 分 别 代 表 了 参与 者 可 能 
会 遇 到 , 并 需 作 出 反应 的 情况 。 从 而 在 扩展 式 中 ,通过 每 个 决策 节 逐 级 道 向 
归纳 求解 的 程序 ,也 就 可 以 看 成 迫使 每 个 参与 者 考 虚实 施 他 可 能 作出 的 每 
一 个 威胁 。 但 是 ,在 一 个 非 完 美 信息 博弈 中 , 问题 就 不 那么 简单 了 , 因为 这 
种 博弈 包含 了 至 少 一 个 非 单 节 的 信息 集 。 我 们 也 可 以 试 着 用 相同 的 方法 ， 
在 扩展 式 中 通过 逆 推 求解 , 总 是 会 到 达 某 个 处 于 非 单 节 信息 集 内 的 决策 节 。 
但 如 果 博 弈 真 的 到 达 了 这 个 决策 节 , 强迫 参与 者 考虑 如 何 行动 , 并 不 等 于 让 
其 考虑 在 一 个 可 能 发 生 的 情况 下 他 将 如 何 行动 ,因为 如 果 博 弈 真 的 进行 到 
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了 这 个 信息 集 , 应 该 行动 的 参与 者 并 无 法 知道 是 否 到 达 了 这 个 决策 节 , Ee 
由 于 此 决策 节 包 含 在 一 个 非 单 节 的 信息 集中 。 

在 道 向 归纳 法 中 ,解决 由 非 革 节 信息 集 引 起 的 向 题 的 方法 之 一 ,是 在 扩 
展 式 中 从 后 往 前 逆 推 求解 , 直到 遇 到 一 个 非 单 节 信 息 集 , CAN TES E, 
径直 越过 该 信息 集 癌 上 , 直到 到 达 一 个 单 节 信息 集 。 然 后 , 不仅 要 考虑 在 这 
个 单 节 信息 集 行动 的 参与 者 在 到 达 此 决策 节 时 如 何 选择 , 还 要 同时 分 析 在 
刚刚 被 越过 的 非 单 节 信息 集 行动 的 参与 者 将 会 如 何 选 择 。 一 般 来 说 ,这 一 
程序 最 后 可 得 到 子 博 弈 畏 炼 纳什 均衡 。 解 决 上 述 问 题 的 男 一 种 方法 , 是 先 
在 扩展 式 中 运用 逆向 归纳 的 方法 , 直到 遇 上 了 一 个 非 单 节 信 息 集 , 然 后 强迫 
在 该 信息 集 行 动 的 参与 者 考虑 如 果 到 达 了 这 一 信息 集 将 如 何 选择 (要 做 到 
这 一 点 ， 必 须要 求 该 参与 者 对 到 达 了 同一 信息 集中 哪 一 个 决策 节 有 一 个 概 
率 上 的 判断 。 这 样 的 判断 当然 义 要 依赖 于 各 参与 者 在 博弈 树 的 更 上 方 可 能 
的 行动 ， 所 以 ， 运 用 这 一 方法 ， 只 对 博弈 树 从 下 往 上 递 推 一 遍 是 无 法 得 到 
结果 的 )。 一 般 而 言 ， 这 一 程序 可 以 得 到 一 个 精炼 贝 叶 斯 均衡 ， 参 见 第 4 
章 。 


2.5 进一步 阅读 


第 2.1 节 关于 没有 工会 组 织 企业 的 工资 和 就 业 , 参 匈 埃 斯 皮 诺 艾 和 
里 (1989, 习题 2.10) 给 出 的 重复 谈判 模型 , 以 及 施 泰 格 (Staiger, 1991) 给 出 
的 单一 谈判 模型 ,其 中 企业 可 以 选择 是 就 工资 和 就 业 同 时 谈判 还 是 只 就 工 
资 进行 谈判 。 关 于 序 贯 谈判 ,参见 费 尔 南 乱 斯 和 格 莱 泽 (Fernandez & Glaz- 
er, 1991) 给 出 的 企业 和 工会 间 讨 价 还 价 的 鲁 宾 斯 坦 式 模型 , 在 原 模型 的 基 
珊 上 叉 增 加 了 新 的 特点 , 即 工 会 必须 决定 如 果 要 价 被 任何 一 方 拒绝 ,是 否 要 
继续 进行 墨 工 , 这 种 条 忻 下 存在 多 个 有 效率 的 子 博弈 精炼 均衡 ,同时 又 支持 
无 效率 的 均衡 ( 即 含 有 罢工 的 均衡 ), 即 使 信息 是 完全 的 。 鄙 斯 本 (COsborne》 
AHERE (1990) 的 专著 里 概括 总 结 了 许多 博弈 理论 的 讨价还价 模型 ,并 
将 它们 与 纳什 关于 讨价还价 的 公理 式 方 法 相 联系 , 并 把 讨价还价 模型 看 成 
是 市 场 理 论 的 基石 之 一 。 

第 2.2 节 关于 银行 挤 提 , 参见 杰克 林 和 巴 塔 查 里 亚 (Jacklin & Bhat- 
tacharya, 1988). Z m Æ {6 McMillan, 1986) 的 著作 中 概括 分 析 了 博弈 论 在 
国际 经 济 学 领域 的 早期 应 用 ;参见 布 龙 和 罗 戈 夫 ({Buion & Rogoff, 1989) 关 
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于 僵 务 危机 的 最 新 研究 成 果 。 关 于 工作 竞赛 ,参见 拉 齐 尔 (1989,. 习题 2.8) 
的 模型 ,其 中 工人 欧 可 以 提高 自己 的 产 基 ,同时 及 可 以 搞 破 坏 ,降低 邮 人 的 
产量 ; 罗 森 (1986) 讨 论 了 一 系列 工作 竞赛 的 情况 ,其 中 一 个 回合 的 失败 者 将 
不 再 参加 以 下 回合 的 竞赛 , 并 求 得 为 维持 激励 而 必须 的 代价 。 

2.37 员 努 志和 克 里 希 纳 【1985) 分 析 了 有 限 重 复 博 弈 。 关 于 重 
PRA SRISRARLAA (1989) 对 有 限 重复 博弈 的 讨论 , URES 
尔 和 马 斯 金 (1989) 对 无 限 重 复 博 弈 的 分 析 和 对 有 关 文 献 的 综述 。 泰 勒 尔 
(1988, 第 6 章 ) 总 述 了 动态 的 骞 头 董 断 模型 。 阿 克 尔 洛 夫 和 叶 林 (Akerlof 
& Yellen ,1986) 的 论文 集 收 集 了 关于 效率 工资 方面 的 许多 重要 论文 ,并 提 
供 了 一 个 整体 上 的 介绍 。 关 于 货币 政策 , 鲁 尔 [Ball ,1990) 对 现存 的 不 同 风 
格 模 型 的 前 提 员 分 析 做 了 回顾 和 总 结 , 并 给 出 了 一 个 解释 通货 脐 胀 时 间 路 
径 的 模型 。 l 

第 2.4 节 克 雷 普 斯 和 威 尔 针 (1982) 关 于 博弈 扩展 式 的 正式 分 析 ; 克 
雷 普 斯 (1990) 还 给 出 了 更 容易 理解 的 文字 表述 。 


2.6 习题 


第 2.1 节 

2.1 本 题 取 自 首先 由 贝克 尔 (Becker, 1974) 提 出 并 分 析 的 一 个 模型 。 
假设 一 个 家 长 和 他 的 夏子 进行 如 下 的 博弈 :第 一 , 小 仿 选 择 一 个 行动 A, 可 
使 孩子 获得 收入 LCA) 并 使 家 长 得 到 收入 f(A)( 可 以 认为 LANAT 
BREA 4 发 生 的 各 种 成 本 后 的 净 收 益 ); 第 二 ,家 长 观测 到 下 入 工 和 了, 然 
后 选择 给 孩子 的 奖励 或 惩罚 Be KTERAK UU, + 8B), 家 长 的 收益 为 
Vil, -B)+k(L +B) 其 中 天 >0 反 映 出 家 长 关心 孩子 的 福利 。 假 定 行 
动 是 一 个 非 负 将 字 , A20, KA Be CA) LCA) APR AS) BE A, 
>0 和 4*>0 达 到 最 大 值 ; 瞻 励 或 秆 罚 8B 为 或 正 或 负 的 数字 ; 且 效 用 函数 
U FV HTA ER EIRA RF" (Rotten Kid) 定 理 ; 在 逆向 归纳 
解 中 , 防 子 选择 可 使 全 家 收入 下 (4)+ 了 (4 ) 最 大 化 的 行为 , BRERA 
数 中 , 只 有 家 长 显示 出 利他 的 特点 。 

2.2 现在 假设 家 长 和 巷子 进行 一 个 不 同 的 博弈 , 首先 由 布 坎 南 
(Buchanan, 1975) 所 分 析 。 令 收入 和 I 为 外 生 给 定 的 , 第 一 ,孩子 决定 收 
AL, PHS OR Fie BSA SH, HRA RBS L- S。 第 二 , 家 
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ERMA SHRE-TM SMB. RPA Ke AK RE 
的 效用 之 和 Ui(I 一 S)+ U2(S+ BB); 家 长 的 收益 为 VCI,-By+t [Ui 
(I,-S)+US+B)]. 假定 效用 函数 U U: M V 递增 并 且 严 格 四 ,证 
明 在 在 "乐善好施 那 论 "(Samaritan’s Dilemma):; 在 逆向 归纳 解 中 , 孩子 的 储 
董 非 常 少 , 从 而 可 诱 使 家 长 给 予 更 高 的 赠与 { 即 如 果 S 增加 ,并 使 B 相应 威 
少 ,家 长 和 孩子 的 福利 都 会 提高 )。 

2.3 假定 鲁 宾 斯 坦 的 无 限期 讨价还价 博弈 中 , 参与 者 的 贴现 因子 不 
同 ,参与 者 1 为 81, 参与 者 2 为 8z。 运 用 本 书 中 的 论证 方法 证 明 在 道 向 归 
纳 解 中 , 参与 者 1 向 2 提出 的 解决 方案 为 

l- (1—1) 


GTa er 1- 6,82 )， 


并 被 参与 者 2 接受 。 

2.4 两 人 台 伏 人 希望 能 完成 一 个 项 目 ,在 项 目 结束 时 ， 每 一 合伙 人 得 到 
收益 YY， 但 结束 前 则 一 无 所 得 ， 尚 需 R 的 成 本 。 两 合伙 人 都 不 能 承诺 只 
灌 自 己 的 力量 完成 项 目 ， 于 是 他 们 决定 进行 如 下 的 两 阶段 博弈 在 第 一 阶 
B, AKA i 选择 为 完成 项 目 所 作 的 贡献 ci， 如 果 这 一 贡献 足以 令 项 目 
完成 ， 则 搏弈 结束 、 每 一 参与 者 得 到 收益 Y; 如 果 这 一 贡献 不 足以 令 项 
BZR 〔 即 ci< 展 )， 则 在 第 二 阶段 合伙 人 2 选择 为 完成 项 目 所 作 的 贡献 
co WÈ (不 考虑 贴现 的 ) 两 个 贡献 之 和 足以 完成 项 目 ， 则 搏弈 结束 ， 每 
一 参与 者 得 到 VW; 如 果 贡 献 之 和 不 足以 完成 项 目 ， 则 博弈 结束 ， 两 参与 
者 所 得 的 收益 均 为 0。 

每 一 合伙 入 必须 从 其 他 可 带 来 收益 的 活动 中 抽取 部 分 资金 , 投入 到 该 
项 目 , 这样 做 的 最 优 方法 是 先 从 收益 最 低 的 其 他 活动 中 抽 资 ,结果 使 贡献 的 
(机 会 ?成 本 为 贡献 大 小 的 凸 函 数 。 稻 设 对 每 一 参与 者 贡献 c 的 成 本 为 c?， 
并 假定 参与 者 1 对 其 第 二 阶段 的 收益 用 贴现 因子 $ 进行 贴现 。 针 对 三 个 
参数 1V,R,681 的 不 同情 沉 ,分 别 计算 出 此 两 阶段 贡献 博弈 惟一 的 逆向 归纳 
解 ;参见 阿 和 花蕊 带 (Admati) 和 仇 蛙 (Perry) 对 无 限 重复 情况 的 讨论 。 

2.5 假设 一 家 企业 希望 某 工 人 能 投资 于 企业 专门 技术 S, 但 此 项 技术 
非常 模糊 , 以致 法 院 无 法 确定 工人 是 否 已 经 掌握。( 例 如, CEFER 
工 " 熟 悉 我 们 这 几 是 如 何 运 作 的 "或 “在 我 们 的 某 浴 在 市 场 或 为 专家 ”。} 从 而 
企业 无 法 与 职工 订立 自 约 , 馈 付 工人 投资 成 本 ;即使 职工 确实 进行 了 投资 ， 
企业 也 可 以 声称 职工 没有 进行 投资 , 并且 法 院 无 法 辨别 哪 一 方 是 正确 的 。 
类 似 的 , 如 果 企 业 预 先 支 付费 用 , 职工 也 不 能 保证 会 投资 于 企业 的 专门 
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技术 。 

了 但 是 ,企业 能 够 通过 (可 信 的 ) 承 诺 提 职 来 激励 职工 进行 投资 , RE 
wml. RRA AAS LR, TARE), -TARD FAS 
门 技术 对 这 两 个 岗位 都 是 有 用 的 , 只 是 对 复杂 的 岗位 作用 更 大 一 些 yd < 
Yen < Yes“ yor AP 站 表示 职工 在 岗位 ;ii = 下 或 刀 ) 工 作 、 技 术 水 平 为 ) 
(= 或 S) 时 的 产 出 , 假定 企业 可 以 承诺 对 不 同 的 岗位 支付 不 同 的 工资 
we 及 wp, 但 每 一 种 工资 都 不 低 于 工大 另 谋 职 业 的 收入, 这 里 我 们 通过 标 
淮北 处 理 , 使 后 者 等 于 0。 

博弈 进行 的 时 间 顺 序 如 下 :在 时 点 0 企业 选 定 we 和 ip: 工人 观测 到 
企业 选择 的 工资 水 平 。 在 时 点 1 工人 加 入 企业 并 且 能 够 以 成 本 c 取得 技能 
S( 这 里 我 们 忽略 了 第 一 阶段 的 产 出 及 工资 ,由 于 工人 尚未 取得 技能 , 企业 
聘用 工人 到 岗位 EE 是 有 效率 的 )。 假 定 yps 一 ypo 庆 cc; 上 全 而 对 工人 来 讲 投资 
学 习 技 术 是 有 效率 的 。 在 时 点 2 企业 观测 工人 是 和 否 取 得 了 技术 技能 , 然后 
决定 是 否 在 工人 亲 佣 的 第 二 (也 是 最 后 ) 了 春 段 提升 工人 到 岗位 万 。 

工人 在 岗位 ;工作 ,技术 水 平 为 耻 时 ,企业 第 二 阶 发 的 利润 为 y; 一 wie 
LAS -O MRE i i CHM KA w; Ew -es 决 定 于 工人 是 否 在 第 一 
PRES CRE. PRU HB WAR. SRC 
(Prendergast, 192) ABE AL RHR. 


第 2.2 节 

2.6 在 一 个 由 三 个 赛 头 垄断 者 操纵 的 市 场 , 反 需 求 函 数 由 P(Q)=a 
-Q 给 出 ,这 里 日 = q+ gq2+ gq3，4; 表示 企业 i 生产 的 产量 。 每 一 企业 生 
产 的 边际 成 本 为 常数 c, 并 且 没 有 辣 定 成 本 。 企 业 按 以 下 顺序 进行 产 出 决 
策 ;(1) 企 业 1 选择 9 20; (2) IL 2 和 $3 观 济 到 gq, 并 同时 分 别 选 择 gz 和 
go 求 出 此 博弈 的 子 博弈 精炼 解 。 

2.7 假设 一 个 工会 是 一 关头 垄断 市 场 中 所 有 企业 惟一 的 劳动 力 供 冶 
者 ,就 像 汽车 工人 联合 会 (United Auto Workers) H} FAA. AA TER S 
等 大 的 汽车 厂家 。 令 博弈 各 方 行动 的 时 间 顺 序 类 似 于 第 2.1.C 节 的 模型 ， 
(1) 工 会 确定 单一 的 工资 要 求 w, 适用 于 所 有 的 企业 ;2) 每 家 企业 i 了解 
到 (并 接受 )w, 然后 同时 分 别 选择 各 自 的 雇佣 水 平 L;; (3) 工 会 的 收益 为 
Cw 一 wIL 其 中 mw。 为 工会 成 员 到 另外 行业 谋 职 可 取得 的 收入 , 工 = 工 1+ 

+L, 为 工会 在 本 行业 企业 的 总 就 业 水 平 ; te: BAA Cw, Li), I 

中 决定 企业 i HAKEHERKM F, 
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所 有 企业 都 有 同样 的 生产 函数 : 产 出 等 于 劳动 力 ; g; = Le HS 
产 出 为 Q= gj teet g, 时 的 市 场 出 清 价 格 为 p(Q}=4a 一 昌 。 为 使 问 
题 简 化 ,假设 企业 除 工 资 支 出 外 没有 另外 的 成 本 。 请 求 出 此 博弈 的 子 博 
弈 精炼 解 。 在 子 博弈 精炼 解 中 , 企业 的 数量 是 如 何 ( 以 及 为 什么 ) 影 响 工 
会 效用 的 ? 

2.8 根据 拉 齐 尔 (1989), 对 第 2.2.D 节 的 工作 竞赛 模型 修改 如 下 ;: 令 
TA i 的 产 出 为 % = ei 一 (1/2)sj + os, EP 5 SO 代表 了 工人 的 故意 破坏 ; 
并 且 工 人 i BECP RBM PEM RMA gle) + g(s;}。 证 
有 明 最 优 的 奖励 水 平 wp 一 w, BDF CP) RA HET te. 

2.9 考虑 两 个 国家 , 在 时 点 1, 两 国 的 关税 都 非常 高 , 以 致 根本 没有 禄 
易 。 在 每 一 个 国家 内 ,工资 和 就 业 的 类 定 与 第 2.1.C FEO TARA 
同 。 在 时 点 2, 所 有 的 关税 都 取消 了 , 每 一 工会 决定 本 国 的 工资 水 平 ,但 每 
一 企业 同时 为 两 国 市 场 生产 产 品 。 

人 根 定 每 一 国家 的 反 需 求 函 数 为 P(Q)=& 一 日 ;其 中 QQ 为 该 国 市 场 上 
的 总 产量 。 令 每 一 企业 的 生产 函数 为 gq 一 工 , 从 而 工资 为 企业 的 惟一 成 本 ， 
并 且 令 工会 的 效用 函数 为 Ulw, L)=(w- wo LENE w BLASER 
业 可 得 收入 。 请 解 出 时 点 工 博弈 的 赣 向 归纳 解 。 

下 面 考 卜 时 点 2 的 下 述 捕 旗 。 第 一 , 两 工会 同时 选择 工资 水 平 w 和 
wn 然后 企业 i 观测 到 工资 并 选择 其 国内 .国外 市 场 的 产 出 水 平 ,; 国企 业 
的 产 出 (内销 和 出 口 ) 分 别 用 ; Me, 表示 。 企 业 i 所 有 的 生产 都 在 本 国 , 于 
是 总 成 本 为 wh + ej), 解 出 子 博 蛮 精炼 解 。 证 明 工 资 、 就 业 和 利润 (并 且 
由 此 决定 的 工会 效用 和 消费 者 剩余 ) 在 关税 取消 后 都 提高 了 。 确 见 Huizin- 
ga (1989) 同 类 问题 的 其 他 例子 。 | 


.第 2.3 9 : 

2.10 王 图 所 示 的 同时 行动 博 赛 重复 进行 两 次 ,并且 第 二 阶段 开始 前 
双方 均 可 观测 到 第 一 阶段 的 结果 , 不 考虑 贴现 因素 。 变 量 KF 4, 因而 
《4,4) 在 一 次 竹 博 弈 中 并 不 是 一 个 均衡 收益 。 对 什么 样 的 x, {双方 参与 者 
同时 采取 ) 下 述 战略 是 一 个 子 博弈 精炼 纳什 均衡 ? 

第 一 阶段 选择 Q, 如 果 第 一 阶段 的 结果 为 (Qi, Q2), 在 第 二 阶段 选择 
Po WRR MENARA O Q) EF y=, 第 二 阶段 选择 R: WRS 
一 阶段 的 结果 为 (Qi 2) HP z#Q., ELR BRRR 5;; 如 果 第 一 阶段 结 
果 为 (4y, zh EP Æ H r+, 则 在 第 二 阶段 选择 P;。 
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2.11 下 图 的 同时 行动 博弈 重复 进行 两 次 ,第 二 阶段 开始 前 参与 双方 
可 以 观测 到 第 一 阶段 的 结果 。 不 考虑 贴现 因素 。 在 一 个 纯 战 略 子 博弈 精炼 
纳什 钧 衡 中 ,能 香 在 第 一 阶段 达到 (4,4) 的 收益 ? 如 果 可 以 ,给 出 相应 的 战 
略 。 如 果 不 能 ,证 明 为 什么 。 


2.12 人 何 为 一 个 重复 博弈 的 战略 ? 何 为 重复 博弈 的 于 博弈 ? 何 为 子 博 
BE Te? 

2.13 ”回顾 习题 1.7 PHE EEA RMR ea). 
同时 给 产品 定价 ;对 企业 i 产品 的 需求 ,如 果 pa pj, Wa — pi; 和 如果 pi> 
Hp H 0; 如 果 pi= pj, WA Ce - p AURREI cLa, SRF LEM 
改 博 弈 的 无 限 重复 博弈 。 证 明 在 一 个 子 博弈 精 烙 纳什 均衡 中 , MARS S 
>1/2 时 , 企业 可 以 使 用 触发 战略 (只 要 发 生 任 何 背离 , 就 永远 转向 阶段 博 
弈 的 纳什 均衡 以 维持 昔 断 条 侍 下 的 价格 水 平 。 

2.14 假设 在 习题 2.43 中 的 无 限 重 复 贝 特 兰 德 博弈 中 的 需求 随机 波 
动 :在 每 一 阶段 ,需求 函数 的 蕉 距 是 ap 的 概率 为 x; 是 alar <an bE 
为 1 一 xz; 不 同 阶段 间 的 需求 相互 独立 。 恨 设 每 一 阶段 两 企业 在 选择 当期 价 
略 之 前 都 可 以 观测 到 本 期 的 需求 水 平 。 两 种 需求 水 平 下 的 垄断 价格 (pp 和 
pi) 分 别 是 几 少 ? 

PE Oo” ,使 得 在 子 博弈 精炼 纳什 艾 瞻 中 , 两 企业 能 够 采用 和 触发 战略 维 
持 上 述 鞋 断 价 格 水 平 ( 即 对 i = HLL, ERO a 时 选择 价格 p,) 的 最 小 贴现 
因子 8 的 值 。 并 对 处 于 172 和 58" 之 间 的 所 有 3, 求 出 最 高 价格 p(8), 使 得 
在 子 博弈 精炼 纳什 均衡 中 , 企业 可 通过 运用 触发 战略 , 在 高 需求 水 平时 维持 
价格 p (8), HER RK ENA op. (BWP RN He Bm, 
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1986} 

2.15 假设 在 一 个 古 诺 靠 头 理 新 中 有 % 个 企业 。 反 需求 函数 由 P 
(Q)=a 一 给 出 ,其 中 = gi+…+g,。 考 虑 基于 这 一 阶段 博弈 的 无 限 
重复 博弈 。 求 出 最 小 的 8 值 , ES ETE aT PE i 
触发 战略 维持 垄断 产 出 水 平 。 这 一 结果 随 n 的 变化 将 如 何 变化 ? 为 什么 ? 
如 果 8 非常 之 小 ,以致 企业 无 法 通过 采用 触发 战略 来 维持 垄断 产 出 , 求 出 
能 够 通过 和 触发 战略 维持 住 的 、 使 利 渔 最 大 化 的 相应 的 子 博 弈 精炼 纳什 均衡 。 

2.16 在 第 2.1.C 节 分 析 的 工资 和 就 业 模型 中 , 道 向 归纳 解 对 社会 来 
讲 并 不 是 有 效率 的 。 并 且 在 实践 中 , 企业 和 工会 今天 就 一 个 3 年 期 合同 的 
条 教 进行 谈判 ,并 将 在 3 年 以 后 再 就 下 一 期 的 合同 条 款 进行 谈判 , 如 此 等 
等 。 从 而 ,两 者 之 二 的 关系 用 重复 博弈 来 表示 可 能 更 为 准确 , 参见 ( 埃 斯 皮 
诺 萨 和 里 , 1989). 

这 个 问题 可 导出 在 无 限 重复 博弈 中 子 博弈 精 炬 纳什 均 街 帕 累 托 优 于 一 
次 性 博弈 中 道 向 归纳 解 的 条 件 。 分 别 用 U* 和 x 表示 一 次 性 博弈 道 向 归 
纳 解 中 工会 效用 和 企业 利润 。 考 虑 另外 的 一 个 工资 一 “就 业 组 合 (zw, 工 ) 
以 及 与 之 相应 的 效用 一 一 利润 组 合 (D, r), 假 设 双方 的 贴现 因子 都 是 8( 每 
3 年 为 一 个 阶段 ), 请 推导 (we, 上) 应 满足 的 条 件 , 使 得 (1)(U, we PRR 
于 (U* ,x*) 且 (2)(U, xx) 为 无 限 重 复 博 弈 的 一 个 子 博 弈 精炼 纳什 均衡 的 
结果 , 其 中 只 村 发 生 任 何 偏 离 就 将 永远 转向 (UU* ,x* )。 

2.17 考虑 如 下 的 一 家 企业 和 一 系列 工人 之 间 的 无 限期 博弈 , 每 名 工 
人 只 出 现在 一 个 阶段 。 在 每 一 阶段 工人 选择 努力 工作 , 这 时 努力 成 本 为 。， 
生产 的 产 出 为 y; 或 不 做 任 何 努 力 , 也 没有 任何 产 出 ,不 发 生 任 何 成 本 。 如 
果 生 产 出 了 产 出 , 企业 拥有 成 果 但 可 以 通过 支付 工资 的 方式 与 工人 分 享 , 具 
体 方法 将 在 后 面 提 到 。 假 定 在 一 个 阶段 的 开始 工人 可 选择 另外 的 就 业 机 
会 ,{ 减 去 努力 成 本 的 ) 净 价值 为 0, 并 且 工 人 不 能 被 强迫 接受 一 个 小 于 0 的 
工资 。 同 时 假定 ”> c, 从 而 努力 工作 是 有 效率 的 。 

在 每 一 阶 眉 内 ,博弈 进行 的 时 间 顺 序 如 下 :首先 工人 选择 一 个 努力 
水 平 , 然 后 企业 和 工人 都 可 以 观察 到 产 出 的 情况 ,最 后 企业 选择 支 村 给 
工人 的 工资 水 平 。 很 定 事先 不 能 达成 任何 有 约束 力 的 工资 协议 :企业 选 
择 的 工资 是 完全 不 受 限制 的 。 那 么 , 在 单一 阶 委 的 博弈 中 , TER 
意味 着 无 论 工人 的 产 出 如 何 , 企业 给 出 的 工资 都 为 0, 于 是 工人 也 不 会 
进行 任何 努力 。 

现在 考虑 无 限期 时 的 情况 , 我 们 已 提 到 每 个 工人 只 出 现在 一 个 阶段 。 
不 过 我 们 可 以 假定 在 阶段 1 的 开始 ,博弈 前 面 : -1 个 阶段 的 进行 过 程 都 可 
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被 将 在 : 阶段 工作 的 工人 观测 到 (可 以 组 象 到 ,这 些 知识 在 工人 之 间 代 代 相 
心 ?。 假 设 企业 未 来 收益 每 一 阶段 的 贴现 因子 为 3。 写 出 无 限期 博 赛 中 一 
个 子 博弈 精炼 均衡 下 企业 和 每 个 工人 的 战略 , 使 得 对 足够 大 的 贴现 因子 S, 
在 均衡 情况 下 ,每 个 工人 都 努力 工作 , 生产 出 产 出 y, 并 绍 出 上 述 均衡 存在 
的 充分 必要 条 件 。 


S243 

2.18 ”对 一 个 任意 的 博弈 ,解释 其 战略 、 信 息 集 以 及 子 博 诗 的 概念 。 

2.19 在 第 2.1.D 节 分 析 的 三 阶段 和 鲁 窒 斯 坦 讨 价 还 价 模型 中 ,我们 解 
出 了 赣 向 归纳 解 。 它 的 子 博 弈 精炼 纳什 均 生 是 什么 ? 

2.20 在 无 限期 鲁 宾 斯 坦 讨价还价 模型 中 考虑 下 面 的 战略 (注意 习惯 
性 的 表示 方法 ,开价 (*,1- *) 意 味 着 参与 者 1 将 会 得 到 *, 参 与 者 2 将 得 到 
1 一;, 而 不 论 是 哪 一 方 提出 的 条 件 ): 令 s* =17A0+ 必 ), 参 与 者 1 坚持 开价 
(s*,l-s*), H#HABY :之 8.s" 时 , 才 接 受 对 方 开价 {5,1 一 s); 参 与 者 2 
坚持 开价 (1- s,s ) ,并且 只 有 当 工 - * 闻 人 .5 时 才 接受 对 方 开价 {s,1- 
*)。 证 明 这 两 个 战略 是 一 个 纳什 均衡 ,并 证 明 这 一 均 街 是 子 博 蛮 精 炼 的 。 

2.21 给 出 第 2.1 节 描 述 的 手 起 捕 赛 的 扩展 式 表 述 及 标准 式 表述 。 并 
分 列 写 出 其 纯 战 略 纳什 均衡 、. 赣 向 归纳 解 和 子 博 弈 精炼 纳什 均衡 。 

2.22 给 出 第 2.2.B 节 讨 论 的 银行 挤 提 博弈 的 扩展 式 表 述 及 标准 式 
表述 。 其 纯 战 路 子 博弈 精炼 纳什 均衡 是 什么 ? 

2.23 一 个 卖方 和 一 个 买方 打算 进行 交易 。 在 他 们 交易 之 前 ,买方 可 
以 作 一 项 投资 ,从 而 提高 标的 物 对 他 的 价值 。 这 项 投资 不 能 被 卖方 观察 到 ， 
有 从 而 也 不 会 影响 标的 物 对 卖方 的 价值 ,后 者 我 们 标准 化 为 0( 举 一 个 例子 ， 
设想 一 家 企业 购买 另 一 企业 , 在 兼并 前 的 一 段 时 间 , 兼并 方 可 以 采取 措施 ， 
改变 其 计划 丰 出 的 产品 ,以 使 之 在 兼并 后 与 被 兼并 方 的 生产 相配 合 。 如 果 
产品 开发 需要 相当 长 时 间 , 而 产品 生命 周期 又 比较 短 ,兼并 之 后 兼并 方 已 没 
有 充足 的 时 间 进 行 此 项 投资 了 )。 购 买方 对 标的 的 初始 价值 为 >0; 一 项 
投资 了 使 得 购买 方 的 价值 变 为 w+ 上 ,但 相应 增加 了 成 本 六。 博弈 进行 的 时 
间 硕 序 如 下 ;首先 ,购买 方 选 择 投资 水 平 [, RERE I?; 第 二 , 卖方 不 能 观 
测 到 1, GRO LAW p; 第 三 , 买方 或 者 接受 , 或 者 拒绝 卖方 的 开 
价 ;如 果 买 方 接 受 , 则 买方 的 收益 为 w+ 了 -pp 一 了 ,卖方 的 收益 为 ;如 果 拒 
绝 , 则 双方 的 收益 分 别 为 - 1? 和 0。 证 明 这 一 博弈 不 存在 纯 战略 子 博弈 精 
堪 纳 什 艾 衡 。 解 出 博弈 的 混合 战略 纳什 均衡 , 其 中 买方 的 混合 战略 中 , 出现 
概率 为 正 的 只 有 两 种 投资 水 平 ,并且 卖方 的 混合 战略 中 ,出现 概率 为 正 的 只 
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有 两 个 价格 水 平 。 
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非 完 全 信 Hs Bs 


从 本 章 开 始 , RINGERS ESRF, SHA ot ee A. 
前 面 讲 这 ,在 一 个 完全 信息 博 弃 中 , SSA Aw te at MS IA; a E 
非 完 全 信息 博弈 中 , SCHR. 至少 有 一 个 参与 者 不 能 确定 另 一 参与 者 
的 收益 函数 。 非 完全 信息 静态 博弈 的 一 个 常见 例子 是 密封 报价 拍卖 
(sealed-bid auction) : 每 一 报价 方 知道 自己 对 所 入 商品 的 估价 , (A mA 
任何 其 他 报价 方 对 商品 的 佑 人 协 ; 各 方 的 报价 放 在 密封 的 信封 里 上 交 , 从 
而 参与 考 的 行动 可 以 被 看 作 是 同时 的 。 不 过 , 绝 大 密 数 在 经 济 领 域 非常 
有 意思 的 贝 叶 斯 博弈 是 动态 的 。 我 们 在 第 4 HSS BAB EHE 
在 十 分 自然 地 导致 享有 私人 信息 的 一 方 试图 去 沟通 (或 者 误导 ), 同时 也 
局 得 没有 私人 信息 的 一 方 试图 去 学 习 和 反应。 这 些 都 是 博 蹇 中 天 有 的 
动态 因素 。 

第 3.1 节 给 出 静态 贝 叶 斯 博弈 的 标准 式 表 述 和 册 叶 斯 纳什 均衡 的 定 
义 。 由 于 这 些 定义 非常 抽象 并 有 些 复杂 ,我们 通过 一 个 简单 的 例子 一 一 非 
对 称 信息 下 的 古 诺 竞 争 一 一 介绍 主要 思想 。 

第 3.2 节 讨 论 三 个 应 用 的 例子 。 第 一 ,我 们 就 第 1 章 中 给 出 的 对 混合 
战略 的 解释 进行 正式 讨论 ;名 参与 者 ; 的 混合 战略 代表 了 工 对 7 所 选择 纯 
战略 的 不 确定 性 ,并 且 j 的 选择 基于 他 所 掌握 的 一 小 点 儿 私 人 人 信息。 第 二 ， 
我 们 分 析 一 个 密封 报价 拍卖 的 例子 , 其 中 竞买 方 的 估价 是 私人 信息 ,但 是 卖 
方 对 商品 的 估价 却 为 各 方 所 周知 。 最 后 , 我 们 考 虚 买方 和 卖方 各 自 都 掌握 
一 定 私人 和 信息 的 情况 (如 在 企业 中 ,企业 了 解 工 人 的 边际 产 出 ,工大 则 知道 
自己 的 机 会 成 本 )。 我 们 分 析 一 个 称 为 双向 拍卖 的 交易 博弈 :卖方 开 出 一 个 
卖 价 , 同时 由 买方 给 出 一 个 买 价 ;如 果 后 者 大 于 前 者 , 则 以 两 个 价格 的 平均 
ÈRE. 

第 3.3 节 我 们 给 出 并 证 明显 示 原 理 (Revelation Principle), 并 简 训 讨论 
其 在 存在 私人 人 信息 时 的 博弈 设计 方面 的 应 用 。 
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3.1 理论 :静态 贝 叶 斯 博弈 和 贝 叶 斯 纳什 均衡 


3.1.A 一 个 鲍 于 : 非 对 称 信 息 下 的 古 诺 竞争 


SOT aR RM. RPT RR RH PQ =a- 
出 ,这 里 Q@= gi+ qa 为 市 场 中 的 总 产量 。 企 业 1 ARER Ci(qg1) = 
cqi; 不 过 企业 2 的 成 本 函数 以 8 的 概率 为 Ci( ga) = cuga 1 - 6 的 概率 为 
C2(q2) = crga XE cr < 之 cn。 并 且 信 息 是 不 对 称 的 :企业 2 知道 自己 的 成 
本 函数 和 企业 1 的 成 本 函数 ,企业 1 知道 自己 的 成 本 函数 ,但 却 只 知道 企业 
2 边际 成 本 为 cp 的 概率 是 人 ,边际 成 本 为 cz 的 概率 是 1 一 Vi 企业 2 可 能 是 
新 进入 这 一 行业 的 企业 ,也 可 能 刚刚 发 明 一 项 新 的 生产 技术 }。 上 述 一 切 都 
是 共同 知识 :企业 1 知道 企业 2 享有 信息 优势 , 企业 2 知道 企业 1 知道 自己 
的 信息 优势 ,如 此 等 等 。 

自然 地 ,企业 2 的 边际 成 本 较 高 时 和 较 低 时 , 它 希 望 生产 的 产 出 水 平 是 
不 同 的 (一 般 而 诗 , 前 一 种 情况 时 的 产 出 要 更 低 一 些 )。 企 业 1 从 自己 的 角 
度 , 也 会 预测 到 企业 2 根据 其 成 本 情况 将 选择 不 同 的 产量 。 用 g2 Cc 
gz (cL) 分 别 把 企业 2 的 产量 选择 表示 为 成 本 的 函数 ,并 令 gr 表示 企业 1 
的 单一 产量 选择 。 如 果 企 业 2 的 成 本 较 高 , 它 会 选择 gz (cr) 满 足 : 


maxl (a -q — q2} — cu lq2 ' 
类 似 地 ， 如 果 企 业 2 的 成 本 较 低 ， gq2 (cL ERE PSR 
max[ (a -qi g2) eLlq2. 


最 后 ,企业 1 知道 企业 2 成 本 较 高 的 概率 为 ,并 应 该 能 预测 到 企业 2 的 产 
量 选 择 特 分 别 为 qz Con) q7 (cr)。 从 而 ,企业 1 工 选 择 满足 下 式 的 qi 


max (a -gu gz CoH) — ela + Q- l(a- gq = qi Cer) -elgi 
以 使 期 望 的 利润 最 大 化 。 
上 面 三 个 最 优化 问题 的 一 阶 条 件 为 
qi (en) = 2 , gi (eq) =, 
及 
» Ola- gz len) — J+ A - @) la - gr (er) -el 
| 一 . 


q 2 
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假定 这 些 一 阶 条 件 可 以 决定 上 述 最 优化 同 题 的 解 (请 回顾 习题 1.6, 在 完全 
fet SAS PR A h, 如 于 企业 阿 的 成 本 差别 足够 太 , 则 在 均衡 情况 下 ,高 
成 本 企业 没有 任何 产 出 。 和 作为 一 项 练习 , 求 出 这 里 不 会 出 现 类 做 问题 的 充 
分 条 件 )。 

三 个 一 院 条 件 构成 的 方程 组 的 解 为 


—2eyt _ 
qi (cy =F r C+ li en- er) + 


a-2erte 
3 


qz eL} = -Elen cr) > 


« _ a@72et byt A Bey 
#1 7 3 - 

把 这 里 的 sz (cng)、g2 (cr) 和 和 gy 与 成 本 分 别 为 cy 和 cs 的 完全 信息 古 
诺 均 街 相 比较 ,假定 ciec 的 取 值 可 使 得 两 个 企业 的 均衡 产量 都 为 正 ,在 完 
全 信息 的 条 件 下 , 企业 1 的 产 出 为 qi = (a -2ri+c)3。 然 而 与 之 不 同 
的 ,在 非 完 全 信息 条 件 下 , at (cy) BB Fle — 2ey + 0/3, g3 Cer MEF 
《aa 一 2cr Tc}/3。 之 所 以 会 出 现 这 种 情 帝 ,是 因为 企业 之 不 仅 根 据 自 己 的 
成 本 调整 其 产 出 ,同时 还 将 考虑 到 企业 1 的 情况 选择 最 优 反 应 。 例 如 , 如 果 
企业 2 的 成 本 较 高 , 它 就 会 因 成 本 较 高 而 减少 产量 ,但 后 时 又 会 生产 稍 多 一 
些 , 因为 它 知道 企业 1 将 根据 期 望 利润 最 大 化 的 原则 决定 产 出 , 从 而 要 低 于 
企业 1 确 知 企业 2 成 本 较 高 时 的 产量 。( 这 一 例子 可 能 会 引起 误解 的 地 方 ， 
是 gr 恰好 等 于 企业 1 在 相应 的 两 个 完全 信息 情 弈 中 古 诺 产 量 的 期 望 值 。 
一 般 情 况 下 这 一 点 是 不 成 立 的 ,例如 可 以 考虑 企业 i 的 总 成 本 为 cg? 的 博 
Mo) 


3.1.B RRA ROSE ER RB 


前 面 已 讲 过 一 个 完全 信息 n 人 博 讲 的 标准 式 表 述 为 G = 1S1,…', Sps 
wi ty} EP S, 为 参与 者 i 的 战略 空间 , u;(51,…', sn 为 所 有 参与 者 分 
SIDER (s,s ) 时 参与 者 i 的 收益 。 不 这 ,根据 第 2.3.B 节 的 讨论 ， 
在 同时 行动 的 全 信息 博弈 中 ,参与 者 的 一 个 战略 就 是 一 个 简单 的 行动 .于 是 
我 们 又 可 以 写 为 GSA oo Arien oub RPA 为 参与 者 i 的 行动 
空间 , aifa ,au) 为 在 所 有 参与 者 分 别 选 择 行 动 ai, …,aw) 时 参与 者 ; 
的 收益 。 为 了 给 下 面 描述 非 完 全 信息 静态 博 变 的 时 间 顺 序 作 准备 , RITA 
把 一 个 完全 信息 静态 博弈 的 时 间 顺 序 描述 如 下 :(1) 参 与 者 同时 选择 行动 
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(参与 者 i MATIRA, 中 选择 a;), 然后 (2) 参 与 者 i 得 到 收益 wi Canen, 
Gado 

现在 ,我们 要 建立 非 完 全 信息 同时 行动 博弈 的 标准 式 表 述 ,也 称 为 静态 
内 叶 斯 博弈 。 首 先 要 表示 出 非 完 全 信息 的 关键 因素 , 即 每 一 参与 者 知道 他 
自己 的 收益 函数 ,但 也 许 不 能 确 知 其 他 参与 者 的 收益 函数 。 令 参与 者 i 可 
能 的 收益 函数 表示 为 ulant ast 其 中 心 称 为 参与 者 ; 的 类 型 
(type), 它 属于 一 个 可 能 的 类 型 集 ( 亦 称 为 类 型 空间 (type space))T;, 每 一 类 
型 5 都 对 应 着 参与 者 i 不 同 的 收益 函数 的 可 能 情况 。 

举 一 个 抽象 的 例子 。 恨 设 参与 者 i 有 两 种 可 能 的 收益 函数 ,我们 也 可 
以 说 参与 者 : 有 两 种 类 型 , 1, 和 ta, 参与 者 i 的 类 型 空间 为 了 Ti; = lea, eit, 
并 且 参 与 者 ; HARARO A a Cay, anit Au; (ays) ans 
tod. KRINVWASSAHR-KRRBH BRS A Tle oe ey BY OY 
能 情况 这 一 思路 ,来 表示 参与 者 有 不 同 可 行 行动 集 时 的 情况 , 具体 方法 如 
下 。 例 如 ,假设 参与 者 i 的 可 行 行动 集 是 1a,51 的 概率 为 g, 是 1a, b,c) É 
概率 为 1- gy, 于 是 我 们 可 以 说 i 有 两 种 类 型 (4 和 41.;, 其 中 i 的 概率 为 
9g), 并 且 对 两 种 类 型 我 们 都 可 以 认为 其 可 行 的 行动 集 是 |a，b，c1, 只 是 对 
类 型 如 定义 其 选择 行动 c 的 收益 为 - eco。 

作为 更 为 具体 的 例子 , 考虑 前 -- 节 里 的 古 诺 博弈 。 企 业 的 行动 是 它们 
的 产量 选择 qg 和 ge Ek 2 有 两 种 可 能 的 成 本 里 数 , 从 和 而 有 两 种 可 能 的 
利润 或 收益 函数 : 

wags 925cL)=[(a -gi q2)— cr]gz 


和 
migis q25CH) 一 [fa 一 q1 ` q2) 一 culgz ` 
企业 1 只 有 一 种 可 能 的 收益 函数 ; 
mlg 923c)= [ta- g1- gq92) -clai - 

我 们 说 企业 2 的 类 型 空间 为 To= ler. cpl, 企业 1 的 类 型 空间 为 T= ict. 

在 这 样 定义 参与 者 的 类 型 之 后 , 说 参与 者 i 知道 自己 的 收益 函数 也 就 
等 同 于 说 参与 者 i 知道 自己 的 类 型 , 类似 地 ,说 参与 者 i 可 能 不 确定 其 他 参 
与 者 的 收益 函数 ,也 就 等 同 于 说 参与 者 ; 不 能 确定 其 他 参与 者 的 类 型 ,我们 
Fb c= lei. trenton tw 表示。 并 用 丁 _ ,表示 :1-; 所 有 可 能 的 值 
的 集合 , 用 概率 p,(: -;|z;) 表 示 参 与 者 在 知道 自己 的 类 型 是 n HART, 
对 其 他 参与 者 类 型 ( 即 : _,;) 的 推断 (belief)。 在 第 3.2 节 分 析 的 所 有 应 用 中 
《以 及 绝 大 多 数 文 献 中 ), 参与 者 之 间 的 类 型 是 相互 独立 的 ,这 种 情况 下 p 
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Galp Se, 不 相关 ,于 是 我 们 可 以 把 参与 者 的 推断 写成 P "了;。 俱 是 
也 存在 参与 者 之 间 类 型 相关 的 情况 , 所 以 在 给 定 静态 贝 叶 斯 博弈 的 定义 时 ， 
我 们 考虑 到 这 种 情况 , 仍 把 参与 者 的 锥 断 写 为 pilt)? 

在 我 们 已 熟悉 的 完全 静态 由 时 斯 博弈 的 标准 式 表述 中 加 土 类 型 和 推断 
这 两 个 新 概念 ,就 可 得 到 静态 贝 叶 斯 博弈 的 标准 式 表 述 。 l 


定 愉 ”一 个 2 人 表态 由 叶 斯 博弈 的 标准 式 表 述 包 括 : 参 与 者 的 行动 空 
E A 及; 它们 的 类 型 空间 Titt Tn 季 们 的 推断 p14,… 记 。 以 及 他 们 
的 收益 函数 vi as BSA i 的 类 型 作为 参与 者 i 的 私人 信息 ,决定 了 
BSA i 的 收益 函数 , ua,(al,…an;t:) 并 且 蚌 可 能 的 类 型 集 T, 中 的 一 个 元 
Ko BSS i 的 推断 pla WORT ARPA CM RAs, 时 ,对 其 他 
nn 一 1 个 参与 者 可 能 的 类 型 1 -_ ;的 不 确定 性 。 我 们 用 G= [Apo Aas Tis 
+, Tai Bis Pitas, a, | RAIL — BR 


根据 训 尔 绍 尼 (1967) 的 假定 ,静态 贝 叶 斯 博弈 的 时 间 顺 序 如 下 :(1) 自 
PRR FB AAA {Et = (+t,…,#,), 其 中 4; 属于 可 行 集合 T;;(2) 
自然 告知 人 参与 者 i 自己 的 类 型 1,, 却 不 省 诉 其 他 会 与 者 的 类 型 ;[3) 参 与 者 
同时 选择 行动 ,每 一 参与 者 i MATRA, 中 选择 a;;(4) 各 方 得 到 收益 u 
(ai,… an3ti)}。 异 助 于 第 一 步 和 第 二 步 中 虚构 的 参与 者 "自然 "的 行动 ,我 
们 可 以 把 一 个 非 完 全 信息 的 博弈 表述 为 一 个 非 完 美 信 息 的 博弈 , 其 中 非 完 
美人 信息 的 含义 (参见 第 2 章 ) 为 在 博 讲 的 某 些 行动 中 ,行动 方 不 知道 这 以 前 
的 博弈 进行 的 整个 过 程 。 这 里 , 因为 在 第 二 步 自 然 告 知 了 参与 者 i 自己 的 
类 型 , 却 没有 告知 参与 者 j, 在 第 三 阶段 参与 者 ; 选择 行动 时 ,i 就 不 知道 整 
个 的 博弈 进行 过 程 。 

在 讨论 静态 贝 叶 斯 博弈 的 标准 式 表 述 的 最 后 , 还 要 担 到 两 个 技术 性 较 
强 的 问题 。 第 一 ,在 有 的 博弈 中 , 参与 者 i 不 仅 对 他 自己 的 收益 函数 掌握 私 
人 信息 ,还 享有 其 他 参与 者 收益 函数 的 私人 信息 。 便 如 在 习题 3-2 中 , 对 第 
3.1. 点 节 非 对 称 信 息 古 诺 模 型 加 以 峰 改 ,使 两 企业 成 本 情况 完全 一 歼 , 但 一 
个 企业 掌握 市 场 需求 水 平 , 男 一 企业 却 不 清楚 。 由 于 需求 水 平 可 以 影响 两 


© ”设想 有 两 个 企业 正比 赛 开发 一 项 新 的 技术 。 每 一 企业 成 功 的 机 会 部 分 依 灯 于 此 项 技术 的 
奴 诬 ,这 一 点 是 未 知 前 。 每 一 企业 只 知道 自己 基 否 已 经 成 动 ,而 不 知道 田 一 企业 进展 如 机 。 不 过 ， 
如 果 企 业 1 成 功 丁 . 则 此 项 技术 前 难度 可 能 不 志 大 ,企业 2 同样 已 经 成 功 的 可 能 性 较 大 。 那 么 . 企 
dk 1 对 企业 2 类 型 的 推断 是 依 输 于 企业 1 对 自己 类 型 的 知识 。 
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个 企业 的 收益 函数 , 知道 市 场 需求 的 企业 的 类 型 也 就 进入 了 另 一 企业 的 收 
BAH., Hin 个 参与 者 的 博弈 中 ,我们 允许 参与 者 i 的 收益 不 公决 定 于 行 
动 组 合 (a1,…, as) ,还 决定 于 所 有 的 类 型 (21,…,t,), 从 而 包含 了 这 一 可 能 
情况 , 并 据 此 把 收益 函数 表示 沟 ulag ans las tado 

第 二 个 技术 性 问题 涉及 到 推断 p;tz -;|z;)}。 我 们 将 假定 在 静态 贝 叶 斯 
博弈 时 间 顺 序 的 第 一 步 , 即 自 然 根 据 先 验 的 概率 分 布 p(z) 赋 对 各 参与 者 类 
型 向 量 1 = (5 ,与 ), 是 共同 知识 。 当 随后 自然 告知 参与 者 i MRM: 
nt, 他 可 以 根据 所 时 斯 法 则 计算 其 他 参与 者 类 型 的 条 件 概率 , 得 出 推断 D 
(e-l 
plf_oty plt-i,t:) 


plti) Pt t) 


mA, 另外 参与 者 根据 i 的 类 型 , 也 能 够 计算 参与 者 i 持 有 的 不 同 推断 , 即 
对 Ti 中 的 每 一 个 4;, 都 可 计算 出 p;(z -;1z;)。 前 面 已 经 提 到 ,我们 将 经 常 
假定 参与 者 的 类 型 是 相互 独立 的 ,这 时 p;(: -;) 不 再 依 束 于 u EMRAN 
BAG p(z), 这 种 情况 下 ,其 他 参与 者 知道 参与 者 i 对 他 们 类 型 所 持 有 的 
推断 。 


3.1.C 贝 叶 斯 纳什 均衡 的 定义 


本 节 我 们 定义 静态 贝 叶 斯 博弈 的 一 个 均衡 概念 。 为 此 , 必须 首先 定义 
此 类 博弈 中 参与 者 的 战略 空间 。 第 2.3.B 和 第 2.4.B 节 已 经 讲 过 , 参与 者 
的 一 个 战略 是 关于 行动 的 一 个 完整 计划 , 包括 了 参与 者 在 可 能 会 遇 到 的 每 
一 种 情况 下 将 选择 的 可 行 行动 。 在 给 定 的 静态 雅 叶 斯 博弈 的 时 间 闫 序 中 ， 
自然 首先 行动 ,下 了 予 每 一 参与 者 各 自 的 类 型 ,参与 者 i 的 一 个 ( 纯 ) 战 略 必须 
包括 参与 者 i 在 每 一 可 行 的 类 型 下 选择 的 一 个 可 行 行动 。 


p(t -i|t;} = 


we TERPS DO BE G= lA t Aas Tisis Tai Pis Prsi 
“cut P RSA i KAREAR S (2), 其 中 对 Ti 中 的 每 一 
类 型 st) 包含 了 自然 赋予 二 的 类 型 为 吉 时, i 将 从 可 行 集 为 ; 中 选择 的 


O 贝 叶 撕 法 则 提供 了 P(tA18) 的 计算 公式 , 即 事件 B 已 经 发 生 后 ,事件 六 特 会 发 生 的 (条 性 》 
概率 。 令 PAJ .PLB) 及 PCA. BMRA A 将 发 生 , BRA, AB EEE HAE 
不 论 A EEB 都 没有 机 会 发 生 之 前 的 概率 ), 民 和 时 斯 法 则 给 出 的 茶 忻 概率 公式 为 PCA1B}= PCA, 
BY P(B), TREIÑ, E BRE, A RENE RST A AB 癌 时 发 生 的 概率 除 以 B 发 生 的 
RARE. 
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不 同 于 (静态 及 动态 的 ) 完 全 信息 博弈 , 在 册 叶 斯 博弈 的 标准 式 表 述 中 
设 有 给 出 参与 者 的 战略 空间 。 作 为 替代 ,在 静态 中叶 斯 博弈 中 战略 空间 可 
从 类 型 空间 与 行动 空间 中 构建 :参与 者 HATH) RS S, 是 定义 域 
AT ERA A; 的 所 有 可 能 的 函数 集 。 例 如 一 个 分 离 战略 (separating 
strategy), T; 中 的 每 一 类 型 都 选择 4; 中 的 不 同行 动 a;; 而 在 混同 战略 
(pooling strategy) 中 ,所 有 的 类 型 都 选择 同一 行动 ,分离 战略 和 混同 战略 的 
这 种 区 别 在 第 4 章 讨论 非 完 全 信息 动态 博弈 时 十 分 重要 , 在 这 里 提 到 这 两 
个 概念 的 区 分 ,只 是 帮助 说 明 从 给 定 的 类 型 空间 Ti 和 行动 空间 A; 中 ,可 以 
构建 出 多 么 宽 汪 而 又 差异 巨大 的 战略 。 

也 许 有 人 认为 ,要求 参 与 者 i 的 战略 包含 参与 者 i 每 一 种 可 能 类 型 下 
的 可 行 行动 没有 必 记 ,毕竟 ,一 旦 自然 赋予 某 参 与 者 一 特定 类 型 并 告知 他 ， 
参与 者 就 不 必 再 关心 如 果 自 然 几 于 他 的 是 另外 一 种 类 型 他 将 如 何 行动 了 。 
但 另 一 方面 ,参与 者 主 还 需要 考虑 另外 的 参与 者 将 如 何 行 动 ,而 且 另 外 参与 
者 的 行动 又 决定 于 他 科 对 参与 者 i 为 了; 中 每 一 类 型 1; 时 , i 的 行动 的 推 
断 。 从 而 ,在 被 赋予 某 种 类 型 之 后 要 决定 如 何 行 动 , 参与 者 i 仍 必 须 考虑 如 
果 他 被 赋予 全 ; 中 另外 每 一 i; 时 应 该 如 何 行 动 。 

作为 例子 ,考虑 第 3.1.A 节 中 的 非 对 称 信息 古 诺 博 弈 ,我们 已 经 说 明 
博弈 的 解 由 兰 个 产量 选择 组 成 :gz Cen), 92 (cL) 及 g7 。 用 刚刚 给 出 的 关 
FRB BES, (ge len) qz (CeL DREE 2 的 战略 , g? 是 企业 1 的 战 
略 , 很 容易 想到 企业 2 根据 自己 的 或 本 情况 会 选择 不 同 的 产量 ,但 基 还 应 注 
意 到 的 同样 重要 的 一 点 ,是 企业 1 在 选择 单一 的 产 出 时 也 应 同样 考 虚 企 业 
2 将 根据 不 同 的 成 本 选择 不 同 的 产量 。 从 而 , RRR SE KE 
业 工 的 战略 是 企业 2 战略 的 最 优 反 应 , 则 2 的 战略 必须 是 一 对 产量 ,分 别 对 
应 于 两 种 可 能 的 成 本 类 型 ,否则 企业 1 就 无 法 计算 它 的 战略 是 否 确 实 是 企 
业 2 战略 的 最 优 反 应 。 

更 为 一 般 地 讲 , 如果 我 们 人 允许 一 个 参与 者 的 战略 不 包括 自 铸 赋 子 他 其 
他 类 型 时 该 参与 者 将 选择 的 行动 ,我 们 就 无 法 把 纳什 均衡 的 概念 运 町 到 见 
叶 斯 博弈 。 这 一 结论 和 第 2 章 的 一 个 结论 是 一 致 的 :在 完全 信息 动态 博弈 
中 ,看 似 没 有 必要 要 求 参 与 者 ;的 战略 包含 参与 者 i 在 可 能 会 遇 到 的 所 有 
情况 下 的 行动 选择 ,但 如 果 我 们 允许 参与 者 的 一 个 战略 不 包含 某 些 可 能 明 
到 的 情况 下 的 行动 选择 , 我们 就 无 法 把 纳什 均 窗 的 概念 运用 于 完全 信息 动 
态 博弈 。 
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给 出 贝 叶 斯 枉 赛 中 关于 战略 的 定义 之 后 , 我 们 就 可 以 定义 贝 叶 斯 纳什 
均衡 了 。 尽 管 定义 中 的 符 导 十 分 复杂 ,但 中 心思 路 却 既 简单 又 热 悉 :每 一 参 
与 者 的 战略 必须 是 其 他 参与 者 战略 的 最 优 反应 , 亦 即 贝 叶 斯 纳什 均衡 实 祭 
上 就 是 在 贝 叶 斯 博弈 中 的 纳什 均衡 。 


定 尽 ”在 静态 贝 叶 斯 博 蛮 G = 141 Ans Tot Tet Bis tts Paiti 
erui P, REAS s" = (sf ,…,s*) 是 一 个 纯 战 略 贝 叶 斯 纳什 均衡 , 如果 
对 每 一 参与 者 i 及 对 i 的 类 型 集 T 中 的 每 一 4, si CE 


max > tl; Cs: Cti), salti) Ges Sear Cards ots Sa (ta)3t) 
本 生生 t ET 


pilta; | g). 
亦 即 , 没有 参与 者 愿意 改变 自己 的 战略 ,即使 这 种 改变 只 涉及 一 种 类 型 下 的 
一 个 行动 。 - 


一 全 有 限 的 静态 贝 叶 斯 博弈 ( 即 情 弈 中 m HERBY, 并且 (Al,…, An) 
和 (Ti,…，, To) 都 是 有 限 集 ) 存 在 贝 叶 斯 纳什 均衡 ,也许 包含 了 混合 战略 , E 
的 证 明 十 分 容易 。 证 明 过 程 与 完全 信息 下 有 限 博弈 中 混合 战略 纳什 均衡 存 
在 性 的 证 明基 本 一 致 ,本 书 略 去 。 


3.2 应 用 举例 


3.2.A HRRARM 


我 们 在 第 1.3.A 节 已 提 到 , 豪 尔 绍 尼 (1973) 提 出 参与 者 的 混合 战略 
代表 了 参与 者 i 对 i 所 选择 的 纯 战 略 的 不 确定 性 , 而 ; 的 选择 又 依赖 于 他 所 
掌握 的 一 小 点 儿 私人 人 信息。 现在 ,我 们 可 以 给 出 这 种 观点 的 精确 表述 :完全 
信息 博弈 的 混合 战略 纳什 均衡 (几乎 总 是 ) 可 以 解释 为 与 之 密切 相关 存在 
一 小 点 非 完全 信息 的 博弈 中 的 纯 成 略 贝 叶 斯 纳什 均衡 (我 们 忽 栈 不 能 够 由 
此 解释 的 极为 罕见 的 情况 )。 用 更 容易 理解 的 话 讲 , 混合 战略 纳什 均衡 的 重 
要 特征 , 不 是 参与 者 j 随机 地 选择 一 个 战略 ,而 是 参与 者 i 不 能 确定 i 的 选 
FE, 这 种 不 确定 性 既 可 产生 于 随机 因素 ,又 可 能 (更 为 合理 地 ) 因 为 一 小 点 儿 
私人 信息 ,如 下 面 的 例子 。 

BAR 1 章 所 讲 的 性 别 战 博弈 ,存在 两 个 纯 战 略 纳什 均衡 (歌剧 ,歌剧 ) 
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Ai, A) R— PES RATT ae, 其 中 克 里 斯 以 273 的 概率 选择 歌 
E, JAFE 2/3 的 概率 选择 拳击 。 


帕 特 


歌剧 拳击 
歌剧 2,1 0,0 
EN 
#5 0,0 1,2 
性 别 战 


现在 假设 尽管 两 人 已 经 认识 了 相当 一 段 时 间 , 但 克 纤 斯 和 凰 特 仍 不 能 
确定 对 方 收 益 函 数 的 情况 。 有 具体 地 说 ,假定 如 果 双 方 都 选择 歌剧 过 里 斯 的 
收益 为 和 + r ER 1 的 值 是 克 里 斯 的 私人 信息 , 双方 都 去 观看 拳击 时 帕 特 
的 收益 为 2+ ep 其 中 2, 的 值 为 帕 特 的 私人 信息 ;iz Ae, 相互 独立 , 并 服从 
[0, x] 区 间 上 的 均匀 分 布 (至 于 选择 [0, x ] 区 间 的 均匀 分 布 并 不 重要 , 只 要 
TE 上 Ale, 的 值 是 指 原 博 弈 收益 的 随机 扰动 项 , 我 们 可 以 认为 x 是 一 个 
很 小 的 正 数 )。 所 有 其 他 情况 下 的 敌 益 不 变 。 表 述 为 标准 式 则 为 :静态 由 人 
斯 博弈 G = An Ags Tes To Peo Pps uo wp} 中 ,行动 空间 为 A= A, = | 歌 
Bl, i, 类 型 空间 为 T,= Ti = [0, x ], 关于 类 型 的 推断 为 对 所 有 的 e 和 
tpr p(tp) = ppt =la 收益 情况 如 下 图 。 
帕 特 


歌剧 源 击 


um wm [a eo) 
ex [oo [ia 


EREA DEN 


我 们 将 构建 出 这 一 非 完 全 信息 性 别 战 博弈 的 纯 战 略 页 叶 斯 纳什 均衡 ， 
其 中 克 里 斯 在 n 超过 某 临 界 值 c 时 选择 歌剧 , 否则 选择 拳击 ; 巾 特 在 r, BE 
AREE p 时 选择 拳击 , A PRM, TERR HT, 克 里 斯 以 (> 一 
<)/z 的 概率 选择 歌剧 , 柏 特 则 以 (* - p)/z 的 概率 选择 拳击 。 我 们 将 证 明 
随 非 完全 信息 的 逐渐 消失 ( 即 随 x 的 值 趋 于 0), 参 与 者 在 这 一 纯 战 略 贝 叶 
斯 纳什 均衡 中 的 行为 , 逐 几 与 原 博弈 完全 信息 条 件 下 混合 战略 纳什 均衡 中 
的 行为 相 一 致 ,也 就 是 随 = 的 值 趋 于 0,(z 一 c)/z 及 (zx 一)/z 都 将 趋 于 
2/3. 
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fit se BI AOR ARRA LT AR, 对 一 个 给 定 的 ,我们 计 
算 相 应 的 < 和 ,以 使 双方 的 战略 符合 贝 叶 斯 纳什 均衡 的 条 件 。 给 定 帕 特 
的 战略 , 克 里 斯 选 择 歌剧 和 选择 拳击 的 期 望 收益 分 别 为 

Por)+ [1- 之 ].0= 之 (2+ te) 
E H EH a 
与 
orti- 2]is É . 
从 而 , 当 且 仅 当 
te> 方 -3 一 人 (3.2.1) 
时 选择 歌剧 是 最 优 的 。 相 似 地 , 给 定 克 里 斯 的 战略 , UO SRE RS chy A BE EK 
剧 的 期 望 收 益 分 别 为 
[1-2 ]-0+ #(24+2,)= (244) 
与 
1 
f1-— ] 1+% 9=1- 二 ， 
从 而 , 当 且 仅 当 
tp>-3=p (3.2.2) 

时 ,选择 拳击 是 最 优 的 。 

解 (3.2.1) 和 (3.2.2) 构 成 的 方程 组 可 得 p==c Rp? +3p-2=0. M 
出 二 次 方程 , 可 得 到 克 里 斯 选择 歌剧 的 概率 ,有 即 (x 一 ce)/zxr, 以 及 帕 特 选择 举 
击 的 概率 ， 即 (z 一 PNZ, 都 等 于 

1- -3+ ¥9t+42 


2 
4c BF OR. RANE TF 273。 人 也 就 是 说 , 随 非 完全 信息 的 消失 ， 
参与 者 在 此 非 完 全 信息 博弈 纯 战略 贝 叶 斯 纳什 均衡 下 的 行动 趋 于 其 在 原 完 
全 信息 博弈 混合 战略 纳什 均衡 下 的 行动 。 


3.2. 了 拍卖 一 种 


考虑 如 下 的 价格 优先 密封 拍卖 (first-price，sealed-bid auction》。 有 两 个 
投标 人 (bidder), 分别 为 1、2, 投标 人 人 i 对 商品 的 估价 为 v; 即 如 果 投 标 
A i tiitt p 得 到 商品 , 则 i 的 收益 为 v; - 志 。 两 个 投标 人 的 估价 相互 
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独立 ,并 服从 [9,1] 区 亿 上 的 均匀 分 布 。 投 标价 格 不 能 为 负 , BRAS 
出 各 自 的 投标 价 。 上 出 价 较 高 的 一 方 得 到 商品 ,并 支付 他 报 的 价格 ; 另 一 方 的 
收益 和 支付 都 为 0。 在 投标 价 相 等 的 情况 下 ,胜利 方 由 掷 和 硬币 块 定 。 投 标 
方 是 风险 中 性 的 , 所 有 以 上 都 是 共同 信息 。 

为 把 这 一 问题 化 为 标准 式 的 静态 见 叶 斯 博弈 , 我 们 必须 确定 行动 空间 、 
类 型 空间 ,推断 及 收益 三 数 。 傅 与 者 i 的 行动 是 给 出 一 个 ( 非 负 的 ) 投 标价 
bi 其 类 型 即 他 的 估价 nif{ 在 抽象 博弈 G= 1 Ay, Aas Ti, Tas pi, pasar, ue! 
中 表示 为 ,行动 空间 A, = [0, %), 类 型 空间 了 ;= [0,11)。 由 于 估价 是 相 垃 
独立 的 , 参与 者 ; 推断 ww 服从 [9,1] 区 间 上 的 均 句 分布 , 而 不 依 束 于 v, 的 
ff. RE 参与 者 i 的 收益 函数 为 


vi 8; 4b; > b, 3, 
WB 62301, V2) = Cw — 8/2 4 6:=b; ， 
0 i pbj. 


为 推导 这 一 博弈 的 贝 叶 斯 纳什 均衡 , 我 们 首先 建立 参与 者 的 战略 空间 。 
前 面 已 讲 过 , 在 静态 贝 叶 斯 博弈 中 ,一 个 战略 是 由 类 型 到 行动 的 函数 。 从 
而 , 参与 者 i 的 一 个 战略 为 函数 5;(w;), 据 此 可 以 决定 i 在 每 一 种 类 型 ( 即 
对 商品 的 佑 昼 ) 下 选择 的 投标 人 昼 格 。 在 页 叶 斯 纳什 均衡 下 , 参与 者 1 的 战略 
bop HBSS 2 的 战略 52(v2) 的 最 忧 反 应 ,反之 亦 然 。 正 式 地 ,战略 组 
合 t5(Cv1),bB(vw2)) 是 由 叶 斯 纳什 均 脆 ,如 果 对 [0,11 中 的 每 一 v bilo) 
满足 


max( Vv; 一 b;) Prob] b; > 6; Ce; )} + Loy, — 6) Prob | b; = biCo)l = 
4. 2 


我 们 假设 该 问题 的 一 组 线性 均衡 解 bilu) = at civi B balu) = aa 
+ evn 并 据 此 对 上 式 进 行 简化 。 但 应 注意 我 们 不 是 限制 了 参与 者 和 的 战略 
空间 ,使 之 只 包含 了 线性 战略 ;而 是 允许 参与 者 任意 地 选择 战略 , 而 只 看 是 
和 理 存 在 线性 的 均衡 解 。 我 们 会 发 现 由 于 参与 者 的 估价 是 均匀 分 布 的 ,这样 
的 线性 均衡 解 不 仅 存在 ,而 且 是 惟一 的 (为 精确 起 见 )。 其 结果 为 bilo) = 
vif2, 也 就 是 说 ,每 一 参与 者 以 其 对 密 品 估价 的 1/2 作为 投标 价 。 这 样 ,一 
个 投标 价格 反映 出 投标 方 在 拍卖 中 再 到 的 最 基本 的 得 失 权衡 :投标 价格 趣 
高 , 中 标的 可 能 性 越 大 ;投标 价格 趟 低 , 一 旦 中 标 所 得 的 收益 就 越 大 。 

假设 参与 者 了 采取 战略 乌 (m) =a, + eup 对 一 个 给 定 的 vw; 值 ,参与 者 
i 的 最 优 反 应 为 下 式 的 解 

max ( v: — 6) Probl h: >a; t col. 
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其 中 我 们 用 到 6, = 如 (wj) 的 概率 为 0 a RE (Probl b; = h} =0,A# b; 
(vJ=a;t cv Hv, 服从 均匀 分 布 ,所 以 6, 也 服从 均匀 分 布 )。 由 于 i 的 
投标 价 低 于 参与 者 ; 最 慨 的 可 能 投标 价格 没有 意义 ,而 高 于 ; 最 高 的 可 能 
BERTH LBB. 我 人 有 a; <b: <La; t cj, 于 是 
Probi 6; > a, + ci = Probl vj < | = 人 . 

从 而 参与 者 i 的 最 优 反 应 为 
(vu; + aj)/2 当 Ue a; 
aj H waj. 
WMR O< <1, 则 一 定 存在 某 些 o, 的 值 ,使 v <a KR 5:(w;) 就 不 可 能 是 
RER TET NS OFA, 后 半 段 开始 倾斜 。 由 于 我 们 要 寻找 线性 的 均 
衡 , 就 可 以 排除 0< a, <1, ELITE a1 及 ws0 的 情况 。 但 前 一 种 情况 
是 不 可 能 在 均衡 中 出 现 的 ,因为 估价 较 高 一 方 对 投标 价 的 最 优选 择 是 不 低 
于 估价 较 低 一 方 的 投标 价 , 我 们 有 c20, 但 这 时 。 1 ERRE b (o) 
ww; 而 这 肯定 不 会 是 最 优 的 。 因 此 ,如 果 要 求 5.(w;) 是 线性 的 , WEA aj 
<0, 这 种 情况 下 6; (v;) = (wi + a;)/2, 于 是 可 得 a; =a;/2 及 ci 一 1/2。 

我 们 可 以 假定 参与 者 i EBR blv) =a; + cv, 对 参与 者 j 重复 上 
面 的 分 析 , 得 到 类 似 的 结果 a, <0, a, = ai/2 以 及 cj = 1/2。 解 这 两 组 结果 
构成 的 方程 组 , 可 得 a, = a;= 人 和 c; = c; = 1/2。 亦 即 前 面 所 讲 的 5;(v;) = 
vif2o 

也 许 有 人 会 关 必 在 此 博弈 中 是 和 理 还 存在 另外 的 贝 叶 斯 纳什 均衡 , 以 
及 如 果 投 标 方 估价 的 概率 分 布 发 生变 化 ,均衡 的 投标 价格 将 如 何 变化 ， 
这 两 个 同 题 都 不 能 应 用 前 面 的 方法 ( 即 先 假定 一 个 线性 战略 , 再 推导 出 
使 战略 符合 均衡 条 件 的 系数 ) 得 到 解答 :试图 猜测 这 一 搏弈 其 他 均衡 中 
的 函数 形式 是 徒劳 的 , 并且 当 估价 服从 任何 其 他 分 布 时 , SE Hy th, AR 
存在 。 在 本 节 的 附录 中 , 我们 推导 一 种 对 称 的 贝 叶 斯 纳什 均衡 ,了 但 仍 
然 是 在 估价 服从 均匀 分 布 的 条 件 下 。 在 参与 者 战略 严格 递增 及 可 微 的 
假定 下 , 我 们 证 明 惟 一 的 对 称 贝 叶 斯 纳什 均衡 就 是 本 节 推 导出 的 线性 均 
衡 。 我 们 所 运用 的 技术 方法 可 十 分 容易 地 扩展 到 较 广 类 型 的 估价 分 布 , 以 


cj 


bilo) = 


D 4P5F HO RRS, 贝 叶 斯 纳什 均 病 就 被 称 为 是 对 称 的 。 也 就 是 说 , 在 一 个 对 称 的 由 
HRR SEF, 存在 一 个 单一 的 5{v;), BS 1 的 战略 blu) A bloh BSE 2 HARM b 
(on A blo), 并 且 此 单一 战略 是 其 自身 的 最 惰 反 应 。 当 热 , 尽 管 双方 都 运用 同一 战略 ,但 由 于 参 
与 者 的 估价 一 盘 是 不 一 致 的 , 他 们 的 投标 价格 一 般 也 不 会 相同 。 
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及 两 个 以 上 投标 者 的 情况 .中 
附录 3.2.B 


假设 参与 者 j KBR SC), 同时 假定 5(:) 严 格 递 增 并 可 微 。 则 对 一 
个 给 定 的 值 由 ,参与 者 i 的 最 优 投 标价 格 访 满足 
max( v; — b Probl bh; > bC )i . 


& b (bo) RRB A j 在 选择 投标 价格 上 5 ERA TH, BnR b; 
=6(v,), W bT C) = vw;。 由 于 wi 服从 区 间 [0,1] 上 的 均匀 分 布 , 5;: >b 
(vj;) 的 概率 等 于 571(61) > vu, 的 概率 , 后 者 又 等 于 b) > wi(Probib;> 
bla )} = Probi a) > yi =b MATASA i 最 优化 问题 的 一 
阶 条 件 为 

oCB) + BEE) =O 


上 面 的 一 阶 条 件 在 给 定投 标 方 i 的 估价 o 时 , 是 关于 投标 方 i 对 投标 方 7 
的 战略 oC ) 最 优 反 应 的 际 函 数 。 如 果 要 使 5(') 成 为 对 称 的 贝 叶 斯 纳什 均 
衡 ,我 们 要 求 一 阶 条 件 的 解 应 该 等 于 5(v;): 也 就 是 说 , 对 参与 者 :i 每 一 可 
REA, 投标 方 1 都 不 希望 背离 战略 5(-), 只 要 投标 方 了 也 选择 同一 战 
略 。 为 加 入 这 一 要 求 ,我们 用 b= b Cu MA BRE, B 


~b-(BCo)) + (vb vi) Eb bo))=0 . 


当然 ,5 Cb (C0;)) 就 是 v 而且 dib lC odb = 1/6 Co), 也 就 是 
说 ,315 Hbl db, 衡量 为 使 投标 价格 发 生 单 位 变动 ,投标 方 i 的 估价 必 
须发 生 多 大 变 尼 ,而 1/5 5 刀 ) 则 衡量 如 时 估价 发 生 单位 变化 , 其 投标 价格 
将 随 之 发 生 包 大 变动 。 从 而 ,5(*) 必 须 满 足 一 阶 微分 方程 

EN 
可 以 将 其 简化 表示 为 bloo + bCv,) = mi 微分 方程 等 式 的 左边 恰好 等 于 
4 18(Cvw)vil/dvi, 对 左右 两 方 同时 积分 得 


blau=ZVitk, 


其 中 为 积分 常数 。 为 消除 2, 我 们 需要 一 个 边界 条 件 。 幸 运 的 是 ,很 简单 
的 经 济 学 理性 就 提供 了 一 个 :没有 参与 者 愿意 出 高 于 自己 估价 的 投标 价格 。 


— vu, + Cv, - 6Cu;)) =. 


中” 跳 过 此 附录 将 不 会 影响 对 以 后 内 容 的 理解 。 
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从 而 , 我 们 要 求 对 所 有 的 vw, 都 有 5(w) 志 wv。 其 一 个 特例 是 当 v = 0, 
RER 5(0y<0。 由 于 投标 价格 被 限制 为 非 负 ,这 意味 着 5(0) =0, 于 是 
下 =0, 并 且 blv) = wy2, 即 前 面 的 结论 。 


3.2.c WAME 


Fm IS BAAR BORER Ae BR, S R 
EHn Mi A (Chatterjee & Samuelson, 1983), (ÆR (Ha DMEF 
和 尔 ,1984) 的 文献 中 ,买方 为 一 家 企业 ,卖方 为 一 个 工人 ,企业 知道 工人 的 边 
际 产 出 ,工人 知道 他 自己 的 机 会 成 本 ,参见 习题 3.8)。 我 们 分 析 一 个 叫做 
双向 拍卖 的 交易 博弈 , 卖方 确定 一 个 卖 价 p,, 买方 同时 给 出 一 个 买 价 ps。 
如 果 pep WB p= (ps + p.)/2 的 价格 进行 ,如 果 p, < pn WPR 
生 交 易 。 

买方 对 标的 商品 的 估价 为 wj, RAHA v 双方 的 估价 都 是 私人 
FE. 并 且 服 从 [0,1] 区 间 的 均匀 分 布 。 如 果 买 方 以 价格 p 购 得 商品 , 则 可 
获得 o- p 的 效用 ;如 果 交 易 不 能 进行 , 买方 的 效 开 为 0。 如果 卖 方 以 价格 
户 售 出 商品 , 则 可 得 到 p — v, 的 效用 ;如 果 交 易 不 能 进行 ,卖方 的 效用 亦 为 
0( 双 方 的 效用 消 数 都 是 衡量 因 交 易 而 带 来 的 效用 变化 , 如 果 交 易 没 有 发 生 ， 
则 双方 效用 均 投 有 变化 。 我 们 也 可 以 把 卖方 效用 定义 为 ; 当 以 价格 op 成交 
时 效用 为 户 ,交易 不 发 生 时 效用 为 v,, 两 者 并 不 存在 实质 区 别 )。 

在 这 一 静态 贝 叶 斯 博 守 中 , 买方 的 一 个 战略 是 函数 palo), AT E 
方 在 每 一 可 能 的 类 型 干将 会 给 出 的 买 价 。 相 似 地 , 对 方 的 一 个 战略 是 函数 
bv). 明确 了 直方 在 不 同 的 估价 情况 下 将 出 的 卖 价 。 如 果 以 下 的 两 个 条 
TFR, 战略 组 合 | ps (ws), pCo)1 即 为 博弈 的 贝 叶 斯 纳什 均衡 :对 [0, 1] 区 
间 内 的 每 一 vs, ps (vo) 应 满足 


a+ EL ul pa he) prob! py p,(v,) (3.2.3) 


其 中 Elp Cu) ps 之 ps(vws)] 为 在 卖方 价格 小 于 买方 价格 的 条 件 下 , 卖方 价 
格 的 期 望 值 。 对 [0, 1] 区 间 的 每 一 ,六 (us 应 满足 


max[ P* El Poles) pole) =P], Probi po v5) ps (3.2.4) 


其 中 EL ploy) | pslvws) 尝 ps] 为 在 买方 价格 大 于 卖方 价格 p 的 条 件 下 , X 
方 价格 的 期 望 值 。 

此 博弈 有 非常 多 的 贝 叶 斯 纳什 均衡 , 作为 一 个 例子 ,考虑 下 面 的 单一 价 
格 均 衡 , 即 如 果 交 易 发 生 , 交易 价格 就 只 是 单一 的 价格 。 对 区 间 [0,1] 上 的 


max [ v 
Py 
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许多 2, SRA PMS ME ye, BE z, E FA 0; A 
时 令 卖 方 的 战略 为 :如 果 oor, WHA x, AR Pa ethAdi. 4 
定 买 方 的 战略 ,卖方 只 能 在 以 价格 2 成 交 或 不 能 成 交 之 间 进 行 选择 , 这 样 
卖方 战略 就 是 买方 战略 的 最 优 反应 , ADM RRA AA 2, hee 
以 价格 a 成 变 , 而 不 希望 没有 交易 , 即 成 交 是 怨 的 最 优 反应 ;反之 亦 然 。 相 
伺 的 分 析 还 可 以 证 明 , 买方 战略 也 是 卖方 战略 的 最 优 反 应 , 从 而 可 证 明 上 述 
战略 为 博弈 的 一 个 贝 叶 斯 纳什 均衡 。 在 这 一 均衡 结果 下 ,图 3.2.1 标 出 区 
域内 的 (wv,, vw) 组 合 都 会 发 生 交 易 ; 而 对 所 有 veo 的 (vw,,; vu AAE, 
交易 都 是 有 效率 的 ,但 图 中 并 影 部 分 虽 满 足 效 率 条 件 , 却 没 有 发 生 交 易 。 


图 3.2.1 


现在 我 们 推导 双向 拍卖 的 一 个 线性 的 贝 叶 斯 纳什 均衡 。 仍 如 上 节 强 调 
的 ,我 们 并 没有 限制 参与 者 的 战略 空间 , 使 之 只 包含 线性 战略 ;而 仍 允 许 参 
与 者 任意 选择 战略 ,看 是 否 存在 一 个 均衡 , 双方 战略 部 是 线性 的 。 除 单一 价 
格 均 衡 和 线性 均衡 之 外 ,博弈 还 存在 许多 其 他 均衡 ,但 线性 均衡 有 着 有 趣 的 
效率 特性 , 我 们 将 在 后 面 进行 分 析 。 
假设 卖方 的 战略 为 po) = as + co 则 p, 服从 区 间 [a,, a, + c,] 上 的 
均匀 分 布 ,于 是 (3.2.3}) 可 化 为 
malu pleat eg eh JT 


由 上 式 的 一 阶 条 件 可 推出 


t= botta, 。 (3.2.5) 
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从 而 ,如 果 卖 方 选择 一 个 线性 战略 , 则 买方 的 最 优 反应 也 是 线性 的 ;相似 地 ， 
假设 买方 的 战略 为 bal vs) = a, + caup, M ps 服从 区 间 [ a,, a, t cs ] 上 的 均 
公分 布 ,于 是 (3.2.4) 可 化 为 
B: t ae F cy, - v, ees , 

2 = 


cs 


mal Ip. 

由 上 式 的 一 阶 条 件 可 得 
p= Fut ilate) : (3.2.6) 
也 就 是 说 , 如 果 买 方 选择 一 个 线性 战略 . 则 卖方 的 最 优 反 应 也 是 线性 的 。 思 
使 参与 双方 的 线性 战略 成 为 彼此 战略 的 最 优 反 应 , 由 (3.2.5) 可 知 c = 


2/3, a, =a,/3, H(3.2.6) FY c,=2/3, a,=(astecs)/3. BA, RES 
战略 为 


2 1 
bolus) = 3 ve + 75 , (3.2.7) 
且 


p(o) =a, + (3.2.8) 


如 图 3.2.2 所 示 。 

前 面 讲 过 , 双向 哲 卖 中 当 且 仅 当 pS pe, 才 发 生 交 易 , 合 并 (3.2.7) 和 
《3.2.8) 的 条 件 可 知 , 在 线性 均衡 中 , YAS ys, +t (1/4} 时 才 会 有 交 
易 发 生 , 如 图 3.2.3 所 示 ( 与 图 3.2.3 的 表示 相 印 证 ,图 3.2.2 说 明了 卖方 
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的 类 型 高 于 3/4 时 ,他 出 的 卖 价 超过 了 买方 的 最 高 可 能 出 价 pelt) = 3/45 
并 且 买 方 的 类 型 低 于 1/4 时 , 他 出 的 买 价 低 于 卖方 的 最 低 可 能 要 价 p,(0) 
= 1/4)。 


ty =u, 十 (L114) 


3.2.3 


比较 图 3.2.1 AR 3.2.3, 它们 分 别 表示 出 在 单一 价格 购 窒 及 线性 均 
Sh, 交易 发 生 所 要 求 的 估价 组 合 。 在 这 两 种 情况 中 , 交易 的 潜在 价值 最 大 
时 (具体 地 讲 , 当 w=0 E vs = 1 时), 都 将 会 发 生 交 易 。 但 是 ,单一 价格 均 
衡 沁 过 了 一 些 有 价值 的 交易 (比如 v,=0 且 unre AP e BEB 
IER), 而 且 还 包含 了 一 些 几乎 没有 什么 价值 的 交易 (比如 和 且 v Sre H 
weate) AHR 在 线性 均衡 中 , 汝 过 了 所 有 价值 不 大 的 交易 , 只 包含 了 
PHEPE 174 以 上 的 交易。 这 表明 从 参与 者 可 得 到 的 期 望 歼 益 的 角度 ， 
线性 均衡 要 优 于 单一 价格 均 本 ,但 间 时 还 需要 研究 是 否 存在 另外 的 均衡 , 其 
中 参与 者 福利 状况 要 更 好 。 

J RRA Ee BB (Myerson & Satterthwaite， 1983) HE 5H, 对 于 这 里 
考虑 的 估 信 的 均匀 分 布 , 双 向 拍卖 的 线性 均衡 中 参与 者 的 期 望 获 益 商 于 博 
讲 的 其 他 任何 贝 叶 斯 纳什 均衡 {包含 但 不 只 限于 单一 价格 均 密 )}。 这 意味 着 
在 双向 拍卖 中 ,不 存在 这 样 的 贝 叶 斯 纳什 均 寅 :交易 当 且 仅 当 有 效率 时 将 会 
REE Ai ye, 时 )。 他 们 了 时 证 明 后 一 结果 相当 普遍 :如 果 me 
EKE ra 六 连续 分 布 ,ww ERE, y, 连续 分 布 ,其 中 y, >r H y> 
x,, 则 买方 和 卖方 之 闻 不 存在 他 们 所 乐于 进行 的 讨价还价 博弈 , 在 其 贝 叶 斯 
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纳什 均衡 中 , 当 旦 仅 当 有 效率 时 交易 发 生 。 在 下 一 节 , 我 们 要 简要 介绍 如 何 
应 用 显示 原理 证 明 这 一 普遍 的 结果 。 和 作为 对 本 节 的 总 结 , 我 们 把 这 一 结果 
其 停 运 用 于 起 尔 和 拉 齐 尔 的 就 业 横 型 ;如果 企业 有 关于 工人 边际 产 出 { m ) 
的 私人 信息 ,工大 则 掌握 自己 机 会 成 本 (ww) 的 私人 信息 , 则 企业 和 工大 之 间 
不 存在 他 们 乐于 进行 的 讨价还价 博弈 , 当 且 仅 当 雇佣 有 效率 ( 即 om St 
达成 雇佣 协议 。 


3.3 显 元 原理 CThe Revelation Principle) 


显示 了 原理 在 页 叶 斯 博 讲 的 条 件 下 最 先 由 迈 尔 森 (4979) 提 出 (其 他 相关 
条 件 下 有 不 同学 者 也 提出 过 类 似 的 结果 ), 是 在 参与 者 掌 手 私 人 信息 时 进行 
博弈 设计 的 重要 工具 。 它 可 应 用 于 前 两 节 讲 这 的 拍卖 及 双边 贸易 问题 , 以 
及 其 他 很 多 类 似 的 问题 。 本 节 我 们 先 给 出 并 证 明 静 态 贝 叶 斯 博 赛 的 显示 原 
奸 { 将 证 明 结 果 扩 展 到 包 合 动态 只 叶 斯 博弈 十 分 简单 )。 不 过 , 在 这 之 前 , 我 
们 简要 介绍 显示 原理 应 用 于 拍卖 及 双边 贸易 问题 中 时 所 起 的 作用 。 

考虑 卖方 夭 望 设计 一 个 拍卖 以 使 他 的 期 望 收 入 最 大 化 ,逐一 列 出 卖方 
可 能 考虑 的 不 同 的 拍卖 方式 是 一 项 事 扣 的 工作 , 例如 在 第 3.2.8B 节 的 拍卖 
中 ,出价 最 高 的 投标 方 付 钱 给 卖方 并 得 到 商品 ,但 还 存在 许 雪 其 他 可 能 。 如 
投标 方 可 能 还 需要 支付 一 定 的 进入 费用 , 更 为 一 般 地 ,一 些 失 败 的 投标 方 也 
不 得 不 付出 一 些 钱 ,其 数量 也 许 依赖 于 自己 和 其 他 人 的 投标 价格 。 另 外 , 卖 
方 也 可 能 会 制定 一 个 底价 一 一 低 于 此 价格 的 投标 价 将 不 会 被 接受 。 其 他 铺 
况 还 包括 ,物品 可 能 会 有 一 定 的 概率 卖 不 出 去 , 而 物品 的 确 卖 出 时 , 也 不 总 
是 卖 给 出 价 最 高 的 投标 方 。 

这 而 卖方 就 可 以 借助 于 显示 原理 来 使 他 的 问题 得 到 非常 大 的 简化 , 这 
有 两 个 方面 。 第 一 ,卖方 可 以 将 其 分 析 集 中 在 以 二 类 型 的 博 弈 ; 

1. 投标 方 同时 声明 (也 许 是 不 诚实 的 ) 他 们 自己 的 类 型 { 即 他 们 各 自 的 
{hit>). Ht i 可 以 自称 其 类 型 为 i 的 可 行 类 型 集 T 中 的 任意 
T 而 不 论 他 的 真实 类 型 :, 是 什么 。 

2. FEA AT AR e ern) BERRA i Wai ei. eB 
MSS Tar rc) 得 至 标的 物品 。 对 所 有 可 能 的 声明 组 合 
{ri 这 之 和 必须 小 于 
或 等 于 1。 
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这 种 类 型 的 博弈 ( 即 每 一 参与 者 惟一 的 行动 就 是 宣布 自己 所 属 类 型 的 静态 
页 叶 斯 博弈 ? 称 为 直接 机 制 (direct mechanism). 

第 二 ,根据 显示 原理 , 卖方 又 可 以 把 分 析 集 中 到 这 样 的 直接 机 制 ,其 中 
每 一 投标 方 实话 实说 构成 一 个 贝 叶 斯 纳 秆 均衡 一 也 就 是 ,设计 适当 的 支 
AY AN ARE BE hay Cras rr) tt te tas ot Tadi gi CEs oe Tae ts Qa 
《ri 和 ri 合 得 每 一 参与 者 ;的 均 街 战略 是 宣布 nl) = +t;, 对 每 一 TT; 中 
的 :2 都 是 如 此 。 裤 话 实 说 形成 只 叶 斯 纳什 均衡 的 直接 机 制 叫 做 激励 相 容 
Cincentive-compatiable} 。 

在 拍卖 设计 之 外 的 其 他 问题 上 , 显示 原理 同样 可 以 用 于 这 两 个 方面 。 
任何 贝 叶 斯 博弈 的 任何 克 叶 斯 名 什 均 衡 都 可 以 重新 表示 为 经 过 适当 设计 的 
一 个 新 的 贝 叶 斯 博弈 的 新 的 贝 时 斯 纳什 均衡 ,这 里 的 “重新 表示 "我们 指 对 
每 一 可 能 的 参与 者 的 类 型 组 合 (t, Lo), MHS SS SHAK 
FIM TSS. PERS AH ART, 新 的 贝 叶 斯 博弈 总 是 
一 个 直接 机 制 。 更 为 正式 地 : 


定理 {显示 原理 ) ”任何 中叶 斯 博弈 的 任何 贝 叶 斯 纳什 均衡 , 都 可 以 重 
新 表示 为 一 个 溅 盛 相 容 的 直接 机 制 。 


在 第 3.2.B 节 分 析 的 拍卖 中 , 我 们 霞 定 投标 方 的 估价 相互 独立 , 同时 
还 假定 {暗含 于 对 投标 方 估价 的 定义 之 中 ) 知 道 投标 方 ; 的 估价 并 不 会 改变 
投标 方 i 的 估价 (尽管 这 往往 会 改变 i 的 投标 价格 )。 我 们 把 这 两 个 假定 所 
表达 的 特点 归纳 为 投标 方 的 估价 相互 独立 , 并 且 是 各 自 的 私人 信息 。 对 这 
样 的 情况 , RR (1981) 计 算出 了 什么 祥 的 直接 机 制 有 实话 实说 的 均衡 ， 
并 且 瞩 一 个 均衡 可 以 使 卖方 的 期 望 收益 最 大 化 。 显 示 原 理 叉 保证 了 没有 另 
外 的 拍卖 机 制 ,其 中叶 斯 纳什 均衡 可 以 惩 卖 方 得 到 更 高 的 期 望 收益 , 因为 这 
祥 的 拍卖 机 制 下 这 桩 的 均衡 已 经 被 重新 表示 为 一 个 直接 机 制 中 的 一 个 实话 
实说 均衡 , 并 且 所 有 这 祥 的 激励 相 容 的 直接 机 制 都 已 考虑 在 内 了 。 迈 尔 森 
同时 还 证 明了 第 3.2.8B 节 中 分 析 的 拍卖 中 对 称 贝 叶 斯 纳什 鬼 衡 就 相当 于 
这 里 的 收益 最 大 化 实话 实说 均衡 (正如 许多 其 他 常见 拍卖 博 蛮 中 的 对 称 均 
衡 一 样 )。 

作为 显示 原理 在 拍卖 中 应 用 的 第 二 个 例子 ,考虑 第 3.2.C 节 措 述 的 双 
边贸 易 问题 , 我 们 分 析 了 买卖 双方 可 能 会 选择 进行 的 一 种 交易 博弈 一 一 双 
MAK, ERE, WETIRE, WCE EH LRA, IRE 
不 能 发 生 , WU et (a EES en ABT. tei, 即使 交 
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易 不 发 生 ,也 可 能 会 有 支付 (从 买方 向 卖方 ,或 者 相反 ), 或 者 交易 发 生 的 概 
率 严 格 地 在 0 和 1 之 间 (0、1 间 的 开 区 间 ); 还 有 ,决定 交易 是 否 发 生 的 条 件 
可 能 会 要 求 买 方 的 出 价 高 出 卖方 要 价 特定 幅度 ( 正 的 或 负 的 ), 而 这 一 幅度 
甚至 还 可 以 依 双 方 出 价 不 同 而 变动 。 

我 们 可 以 通过 以 下 类 型 的 直接 栅 制 把 所 有 这 些 可 能 性 都 考虑 进去 : 买 
方舟 卖方 同时 就 各 自 的 类 型 作出 声明 ,表示 为 mm 和 = 之 后 买方 支付 给 卖 
方 区 ray e), APAA EEA AAR, FL girs tT) 的 概率 获得 物品 。 近 
尔 森 和 萨 特 思 韦 特 推导 出 什么 样 的 直接 机 制 有 实话 实说 均 街 ,并 且 提 出 了 
双方 在 每 一 种 类 型 下 愿意 参加 博弈 的 约束 条 件 ( 即 双方 在 每 一 种 类 型 下 均 
衡 的 期 望 收 益 不 低 于 该 种 类 型 拒 弧 参加 时 可 得 到 的 收益 一 一 具 笨 地 说 , 拒 
绝 参 加 时 ,买方 的 每 一 类 型 1; 和 喜 方 的 每 一 类 型 1, 的 收益 都 为 0)。 最 后 ， 
他 们 还 证 明 所 有 激励 相 容 的 直接 机 制 都 不 能 达到 交易 当 且 仅 当 有 效率 时 肯 
定 发 生 的 概率 为 1。 从 而 显示 原理 也 保证 了 不 存在 这 样 的 双方 都 乐于 参加 
的 讨价还价 博弈 ,在 其 贝 叶 斯 纳什 均衡 中 , 当 且 羽 当 有 效率 时 交易 发 生 。 

为 给 出 显示 原理 的 正式 表述 及 其 证 明 ,在 静态 贝 叶 斯 博弈 G = jA, 
en Aas Tpu Trs pis tt Pai tp t nt P, AE HAAA ”= 
(s7 了 ,…, sao RINE -T AAR OH EEN Baa 
so WaRFH ARO te > AS OL SE, A G 有 相同 的 类 型 空 
间 和 推断 , 但 其 行动 空间 和 收益 函数 却 不 一 样 。 新 的 行动 空间 非常 简单 , 直 
接 机 制 中 参与 者 i 的 可 行 行 动 就 是 (可 能 是 不 诚实 地 ) 声 明 ; 的 所 属 类 型 ， 
这 就 是 说 , 参与 者 i 的 行动 室 间 为 个 。 新 的 收益 函数 就 复杂 多 了 ,它们 不 
Tiki FRB G, CRETE HI s*. MBM KBE IE G 
的 均衡 解 ;" SE PRUE SEG SEU Ae BLD a, 具体 证 明 步 骤 如 下 。 

说 * 是 的 一 个 贝 叶 斯 纳什 均衡 ,意味 着 对 每 一 参与 者 i, ;7 为; 对 
其 他 参与 者 战 栈 1s7 3) 的 最 优 反 应 。 更 为 具体 地 , 对 
的 每 一 种 类 型 1, E Ta si (4;), 都 是 i 对 给 定 其 他 参与 者 的 战略 为 (s7 g 
sias Siris ttt Sh ) 时 , 从 Ay 中 选择 的 最 优 行动 。 那么 ， 如 果 i 的 类 型 为 fis 
HHR i AA PAR s; (2;) 的 一 个 子 集 中 选择 行动 ,仍然 假定 其 他 
参与 者 的 战略 为 (57 she shea Sas 则 的 最 优选 择 仍 为 5s (2;)。 
选 定 直接 机 制 中 的 收益 函数 时 , 就 是 设法 使 每 一 参与 者 面临 和 上 面相 同 的 
选择 。 

确定 直接 机 制 中 收益 范 数 的 方法 如 下 :首先 将 新 博弈 中 参与 者 关于 类 
型 的 声明 c= (ri vvro) 代 入 原 博 弈 中 的 均衡 战略 ; , 然后 将 求 得 的 原 博 
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弈 的 均衡 行动 (rz)=(7tiri se, DRAB HK ee. A 
公式 表示 ,7 mA 

Test) 一 ai tr), l], 
HP rS {tpt 之 所 以 会 得 到 这 样 的 收益 函数 , 我 们 可 以 设想 六 ”个 
局 外 人 在 各 参与 方 之 闸 进 行 联系 , 半 作 内 容 如 下 的 谈话 : 

我 知道 你 们 都 知道 自己 的 上 型 ,并 绅 准 备 在 博弈 G 中 选择 均衡 战略 
st. 我 希望 你 们 参加 一 个 新 的 博弈 , 即 直接 机 制 。 首 先 , 你 们 每 一 个 人 都 要 
签订 一 份 合约 , 多 许 以 后 再 进行 情 蛮 GG 时 由 我 指定 你 们 的 行动 ;第 二 , 你们 
每 一 个 人 都 写 出 对 自己 类 型 的 声明 ri, 并 交 给 我 ;第 三 , 我 会 用 每 个 参与 者 
TERIA HAAR ce, ,代入 原 博 弈 参与 者 的 均衡 战略 s?, 计算 出 如 果 
参与 者 的 类 型 真 的 是 o OT, MES s” 中 将 会 如 何 行动 也 就 是 :> 
(7). BUS, 我 将 指定 你 们 每 一 个 人 选择 我 为 你 们 计算 出 的 行动 ,并 且 你 们 
会 得 到 这 一 结果 带 来 的 收益 ( 它 依赖 于 每 人 的 行动 与 你 们 真实 的 类 型 }。 

本 节 的 最 后 , 为 完成 对 显示 原理 的 证 明 , RE a E E 
HEPA A RATS. BHP AACR CT, 参与 者 i 事实 
上 就 等 于 从 4; 中 选择 了 行动 s? (ce). 如 果 所 有 其 他 参与 者 都 实话 实说 , 则 
他 们 事实 上 等 于 选择 了 战略 (1 ,ss cose he BAERNDE 
证 明 , 如 果 他 们 选择 了 这 样 的 战略 , 则 当 + 的 类 型 为 疡 时 ,: 可 选择 的 最 优 
行动 为 si (六 那么 ,如 果 其 他 参与 者 实话 实说 , 则 当 # 的 类 型 为 所 时, 他 的 
SREP AA CHA, 也 就 是 说 ,实话 实说 是 一 个 均衡 解 。 
EAER, TEAS OL OF RSET, Tas Toce Tas Paes Pad Vie > 
o,f 中 .对 T, 中 的 每 一 种 7., 每 一 参与 者 ; 选择 实话 实说 战略 T) = t 
成 一 个 只 叶 斯 纳什 均衡 。 


3.4 进一步 阅读 


和 近 尔 森 (1985) 对 由 时 斯 博弈 、 贝 时 斯 纳什 均衡 久 显 示 原 理 提 供 了 更 为 
TEAM AS St 28. BER AE (McAfee) Al € 56K FE (1987 ) A E RT FH SE 3 ARE 
一 个 很 好 的 综述 ,包括 对 优胜 者 的 诅咒 (winner"s curse) WITHA. AIBA SE 
伦 佩 雷 尔 (Bulow & Klemperer，1991) 把 第 3.2.B 节 的 拍 站 模型 进行 了 扩 
展 ,对 {比如 说 } 房 产 市 场 中 理性 的 疯狂 及 崩溃 提供 了 一 个 颇 上 县 说服 力 的 解 
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释 。 关 于 非 对 称 信息 下 的 就 业 , 参见 迪 尔 Deere, 1988) 分 析 的 一 个 动态 模 
型 ,其 中 工人 在 一 定时 间 内 顺序 向 一 系列 企业 求职 , 每 一 企业 都 作为 私人 信 
息 了 解 工 人 的 边际 产 出 。 关 于 显示 原理 的 应 用 ,参见 巴 伦 (Baron) 和 迈 尔 森 
政府 对 不 了 解 成 本 情况 的 至 断 企业 进行 规制 的 模型 , 喻 特 (Hart，1983) 关 
于 隐 含 合约 及 非 自愿 失业 的 分 析 , RF (Sappington 1983) 的 代理 理 
论 。 


3.5 习题 与 练习 


第 3-1 Vi 

3.1 ”什么 是 静态 贝 叶 斯 博弈 ? 什么 是 静态 贝 叶 斯 博弈 的 一 个 ( 纯 ) 战 
E? 什么 是 它 的 ( 纯 战 略 ? 贝 叶 斯 纳什 均衡 ? 

3.2 考虑 下 面 的 古 诺 双 头 董 断 模 型 。 市 场 的 反 需 求 画 数 为 p(Q)=a 
-Q.F Q=žq tgo 为 市 场 总 产量 。 两 个 企业 的 总 成 本 都 为 olg) 
cgi; 但 需求 却 不 确定 :分 别 以 8 的 概率 为 高 (a = ap), 以 1- 的 概率 为 低 
(a 二 ar)。 还 有 ,信息 也 是 非 对 称 的 :企业 1 知道 需求 是 高 还 是 低 , 但 企业 > 
不 知道 。 所 有 这 些 都 是 共同 知识 。 两 企业 同时 进行 产量 决策 。 请 确定 这 两 
个 企业 的 战略 空间 ? 假定 aya 和 < 的 取 值 范围 使 得 所 有 均衡 产 出 都 
是 正 数 ,此 博弈 的 贝 叶 斯 纳什 均衡 是 什么 ? 

3.3 ” 考 虚 下 面 的 多 兰 特 德 双 涉 垄 断 模 列 在 非 对 称 信息 下 的 情况 ,两 企 
业 的 产品 存在 差异 。 对 企业 的 需求 为 gq;( pi p) =a- hi- h p 两 企业 
的 成 本 都 为 0。 企 业 i 的 需求 对 企业 i 价格 的 敏感 程度 有 可 能 较 高 ,也 可 能 
较 低 ,也 就 是 说 , b: 可 能 等 于 5 也 可 能 等 于 各, 这 里 by >, >>0。 对 每 一 
个 企业 , b= by 的 概率 为 9, 6; = 6, 的 概率 为 1 -98, 并 与 6 的 值 无 关 。 每 
一 企业 知道 自己 的 5;, 但 不 知道 对 方 的 , 所 有 这 些 都 是 共同 知识 。 此 博弈 
中 的 行动 空间 .类 型 空间 .推断 以 及 效用 函数 各 是 什么 ? 双方 的 战略 空间 各 
是 什么 ”此 博弈 对 称 的 纯 战略 贝 叶 斯 纳什 均 陋 应 满足 哪些 条 件 ? 求 出 这 样 
的 均衡 解 。 

3.4 在 下 面 的 静态 贝 叶 斯 博弈 中 , 求 出 所 有 的 纯 战 略 贝 叶 斯 纳什 均 
E: 

1. 自然 决定 收益 情况 由 博弈 1 4, eh a 2 给 出 ,选择 每 一 博 

弈 的 概率 相等 ; 
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2.654 1 了解 到 自然 是 选择 了 博弈 1, 还 是 选择 了 博弈 2, 但 参与 者 
2 不 知道 ; 

3. 参与 者 1 选择 相等 个 或 B, 同 时 参与 者 2 选择 上 或 RR; 

4, 根据 自然 选择 的 博弈 , 两 参与 者 得 到 相应 的 收益 。 


WH 1 博弈 2 


43.2 节 
3.5 ”回顾 第 1.3 PRINS ANH RTS BRS 
弈 ) 笠 存在 纯 战略 纳什 均衡 ,但 有 一 个 混合 战略 纳什 均衡 :每 个 参与 者 都 以 
1/2 的 概率 选择 出 正面 。 
参与 者 2 


正面 背面 


正面 1. -1 -1,1 
wa -1,1 i, -1 


对 与 该 搏弈 相对 应 的 非 完 全 信息 博弈 , RR — a A D o 
衡 ,使 得 非 完 全 信息 趋 于 消失 时 , 参与 者 在 贝 呈 斯 纳什 均衡 下 的 行为 达到 其 
在 原 完 全 信息 博弈 中 混合 战略 纳什 均衡 下 的 行为 。 

3.6 考虑 一 个 价格 优先 密封 拍卖 , 其 中 投标 方 的 估价 相互 独立 ,并 服 
从 区 同 [0,1] 上 的 均匀 分 布 。 证 明 如 果 有 凡 个 投标 方 , 则 以 各 自 估价 的 (Cn= 
—1)/n 倍 作为 投标 价格 是 这 一 拍卖 的 一 个 对 称臣 时 斯 纳什 均衡 。 

3.7 BARMI AR (1984) 把 第 3.2.C 节 分 析 的 双向 拍卖 的 买方 和 卖 
方 的 角色 作 了 改动 ,分 别 代 之 以 企业 和 工人 ,其 中 企业 短 道 工人 的 边际 产 出 
(Cm), 工大 知道 自己 的 机 会 成 本 (w)。 在 这 种 情况 下 , 交易 意味 着 工人 被 企 
WAR, 双方 交易 的 价格 就 是 工人 的 工资 w。 如 果 发 生 了 交易 , 则 企业 
的 收益 为 mx — w, 工人 的 收 荔 为 四 :如果 不 发 生变 易 , 则 企业 的 收益 为 0. 工 
人 的 收益 为 v。 

和 和 前面 相同, 假定 m 和 w 相互 独立 ,服从 区 间 [0,1] 上 的 均匀 分 布 。 为 
了 进行 比较 ,计算 双向 拍卖 中 双方 参与 者 在 线性 均衡 下 的 期 望 收益 。 并 改 
变 双 向 拍卖 的 条 件 , 考虑 如 下 两 个 交易 博 讲 : 


参与 者 1 
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博弈 了 :在 双方 了 解 到 各 自 的 私人 信息 之 前 , 他 们 先 订 立 一 份 合约 , 规 
定 如 果 工 人 被 企业 所 和 雇佣, 则 工人 的 工资 为 w, 但 同时 任何 一 方 都 可 以 无 
成 本 地 解除 雇佣 关系 。 在 双方 了 解 到 各 自 的 私人 信息 后 , 他 们 同时 宣布 是 
接受 工资 z 还 是 拒绝 。 如 果 双 方 都 宣布 接受 , 则 交易 发 生 ; 和 否则 交易 不 能 
. 发生。 对 给 定 的 [0, 1] 之 间 的 任意 w, 此 博弈 的 贝 叶 斯 纳什 均衡 是 什么 ? 
参照 图 3.2.3 的 方式 , 表示 出 交易 发 生 的 类 型 组 合 。 求 出 使 双方 参与 者 期 
望 收益 之 和 最 大 的 w 值 , 并 求 出 这 时 的 期 望 收益 之 和 。 

博弈 开 ; 在 了 解 到 各 自 的 私人 信息 之 前 , 双方 签订 一 份 合约 ,规定 将 运 
用 以 下 的 动态 博弈 来 决定 工人 是 否 加 入 企业 ,及 一 旦 加 入 时 的 工资 水 平 ( 严 
格 地 说 ,这 里 的 博弈 属于 第 4 章 的 内 容 。 我 们 将 合并 运用 本 章 及 第 2 Rit 
到 的 知识 ,求解 此 博弈 , 从 而 也 可 以 起 到 温 故 而 知 新 的 作用 )。 在 双方 了 解 
到 各 自 的 私人 信息 之 后 ,企业 向 工人 开 出 工资 水 平 m, 工 人 既 可 以 接 爱 , 也 
可 拒绝 。 试 着 用 逆向 归纳 法 分 析 这 一 博弈 。 请 参考 第 2.1.A 节 对 完全 信 
息 博 弈 进行 的 燃 似 分 析 , 可 沿 以 下 的 思路 :对 给 定 的 w M o, TAY iti 
择 ? 如 果 企 业 预 测 到 工人 的 选择 , 对 绽 定 的 m, 企业 又 将 恕 何 决策 ? 这 时 双 
方 参与 者 的 期 望 收益 之 和 是 多 少 ? 
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第 4 章 


非 完全 信忠 动态 博弈 


本 章 我 们 将 介绍 另 一 种 新 的 均衡 概念 一 精炼 贝 叶 斯 均衡 , 从 而 在 这 
四 章 中 就 有 了 四 个 均衡 辑 念 :完全 信息 静态 博弈 中 的 纳什 均 衙 .完全 信息 动 
态 铺 弈 中 的 子 博弈 精炼 纳什 均衡 、. 非 完全 信息 静态 博弈 中 的 贝 叶 斯 纳什 均 
窒 以 及 非 完全 信息 动态 博 奔 中 的 精炼 贝 叶 斯 均衡 。 看 起 来 我 们 好 像 对 所 研 
究 的 每 一 类 型 的 博弈 都 发 明 出 了 一 种 新 的 均 奖 概念 ,但 事实 上 这 些 概念 又 
是 密切 相关 的。 随 我 们 研究 的 博弈 还 步 复杂 ,我 们 对 均衡 概念 也 逐 订 强化， 
从 而 可 以 排除 复杂 博弈 中 不 合理 或 没有 意义 的 均衡 ,而 如 果 我 们 运用 适用 
于 简单 博弈 的 均衡 概念 就 无 法 区 分 。 在 每 一 种 情况 下 , 较 强 的 均衡 概念 只 
在 应 用 于 复杂 的 博弈 时 才 不 同和 于 较 弱 的 均衡 概念 , 而 对 简单 的 博弈 并 没有 
区 出 。 具 体 好 说 , 精 栋 贝 叶 斯 均衡 在 非 完 全 信息 静态 博弈 中 即 等 同 于 夏 叶 
斯 纳什 均衡 ,在 完全 信息 动态 博弈 (以 及 在 许多 完全 非 完 美 信息 动态 博弈 ， 
包括 第 2.2 节 及 第 2.3 节 讨 论 过 的 博弈 ) 中 等 同 于 子 博 弈 精炼 纳什 均衡 ,在 
完全 信息 静态 博弈 中 等 同 于 纳什 均衡 。 

引入 精炼 贝 叶 斯 均 本 的 目的 是 为 了 进一步 强化 (有 即 加 强 对 条 忻 的 要 求 ) 
由 时 斯 纳什 均 奖 ,这 和 子 博 弈 精 烽 纳什 均 竹 强化 了 纳什 均衡 是 相同 的 。 正 
如 我 们 在 完全 信息 动态 博弈 中 加 上 了 子 博弈 精炼 的 条 件 , 是 因为 纳什 均衡 
无 法 包含 威胁 和 承诺 都 应 其 可 信和 的 这 一 思想 ;我 们 在 对 非 完 全 信息 动态 博 
弈 的 分 析 中 将 集中 于 精炼 贝 叶 斯 均 痊 , 是 因为 贝 叶 斯 纳什 均衡 也 存在 同样 
的 不 足 。 回 左前 面 讲 过 的 , 如果 参与 者 的 战略 要 成 为 一 个 子 博 弈 精炼 纳什 
均衡 , 则 它们 不 仅 必 须 是 整个 博弈 的 纳什 均衡 , 还 必须 是 其 中 每 一 个 子 博 蛮 
的 纳什 均衡 。 在 本 章 中 , 我 们 用 更 为 广 扩 的 后 续 博 弈 (continuation game) 的 
概念 来 代替 子 博弈 的 概念 一 一 前 者 可 始 于 任何 完全 信息 集 { 和 而 不 论 是 否 单 
PS) RRMA GPR THER. BS, 我 们 进行 相似 的 分 析 :如果 参 与 者 
的 战略 要 成 为 博弈 的 一 个 精炼 贝 叶 斯 均衡 ,它们 不 仅 必须 是 整个 博弈 的 内 
时 斯 纳什 均衡 ,而且 还 必须 构成 每 一 个 后 续 博 弈 的 贝 叶 斯 纳什 均衡 。 
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在 第 4.1 节 我 们 一 般 人 性 地 介绍 精炼 忠 叶 斯 均衡 的 主要 特征 。 为 此 , 我 
们 暂时 采用 与 上 面 强调 的 内 容 相 反 的 第 二 (互补 的 } 理 解 :精炼 由 叶 斯 均 稀 
通过 对 参与 者 推断 的 隐 含 的 分 析 , 强化 了 子 博 弈 精炼 纳什 均衡 的 要 求 ,这 也 
和 中 叶 斯 纳什 均衡 是 相似 的 。 这 种 第 二 理解 首先 由 豪 尔 绍 尼 (1967) 提 出 ， 
因为 我 们 可 以 把 一 个 非 完 全 信息 博弈 描述 为 一 个 非 完美 信 息 博 灾 自然 
告知 参与 者 i 他 的 类 型 却 没 有 告知;, 于 是 参与 者 了 就 不 知道 博弈 进行 的 完 
PiE. Hit, 一 种 为 在 非 完全 信息 动态 博弈 中 强化 贝 叶 斯 纳什 均衡 而 设 
计 的 均衡 概念 ,同样 可 以 强化 完全 非 完 美 信息 动态 博 讲 中 的 子 博 弈 精 卉 纳 
什 均衡 。 

在 第 4.2 节 我 们 分 析 非 完全 信息 条 和 件 下 应 用 最 广 的 博弈 类 型 :信号 博 
- (signaling game)。 用 抽 旬 的 语言 表述 ,信号 博弈 包含 两 个 参与 者 (其 中 之 
ARARE, 另 一 个 没有 ), 两 步行 动 ( 首 先 由 掌握 私人 信息 的 一 方 发 出 一 
个 信和 号 ,然后 没有 私人 信息 的 一 方 作 出 反应 }。 其 主要 思想 是 , 如 果 某 类 有 
私人 信息 的 参与 者 愿意 发 出 一 种 信号 ,而 另外 类 型 的 参与 者 因 成 本 太 高 元 
法 发 出 同样 的 信和 号, 则 交流 就 可 达成 。 首 先 ,我们 定义 信号 博弈 的 精炼 贝 叶 
斯 均衡 ,并 描述 可 能 存在 的 不 同 种 类 的 均衡 结果 (分 别 对 应 于 不 同 程度 的 交 
流 ,从 没有 交流 到 完美 交流 )。 其 后 ,考虑 斯 豆 斯 (Spence, 1973) RE OS 
的 就 业 市 场 信 号 模型 , 以 及 迈 尔 斯 和 迈 卢 赤 (Myers & Majluf, 1984) 的 公司 
投资 模型 和 维 克 斯 (Vickers, 1986) 的 货币 政策 模型 。 

在 第 4.3 节 我 们 讨论 精炼 贝 叶 斯 均 病 的 其 他 应 用 。 首 先 介绍 克 劳 福 德 
和 索 贝 尔 (1982) 对 空谈 博弈 (cheap-talk game) 的 分 析 ( 即 所 有 的 信和 号 都 不 
需 任 何 成 本 的 信和 号 博弈 ), 该 模型 的 应 用 包括 总 统 否决 权威 胁 . 联 邦 储 备 委 
员 会 关于 货币 政策 的 表态 ,以 及 组 织 内 部 的 交流 (或 “声音 ”(voice))。 在 空 
谈 搏 弈 中 , 交流 的 程度 决定 于 参与 者 利益 在 多 大 程度 上 是 共同 的 , 而 不 在 于 
不 同类 型 参与 者 发 出 信号 的 成 本 差异 。 其 后 我 们 研究 案 贝 尔 和 高 桥 (1983) 
的 序 贯 谈判 模型 ,其 中 企业 必须 要 章 受 一 次 黑 工 以 表明 它 无 法 支付 更 高 的 
工资 (比较 第 2.1.D 节 中 重 宾 斯 坦 的 完全 信息 谈判 模型 , 在 均衡 情况 下 不 
会 出 现 黑 工 )。 最 后 ,我们 将 介绍 克 雷 普 斯 、 米 尔格 龙 (Milgrom})、 罗 伯 获 以 
及 威 尔 导 (1982) 等 人 十 分 重要 的 研究 结论 ,他们 分 析 了 声誉 (Reputation) 在 
有 限 重 复 的 四 徒 困境 中 达成 理性 合作 的 关键 作用 (参照 第 2.3.A 节 得 出 的 
结论 ,阶段 博弈 有 惟一 纳什 均衡 的 有 限 重 复 博 弈 , 有 惟一 的 子 博弈 精炼 纳什 
均衡 , 即 阶段 博弈 的 纳什 均衡 重复 n 次 )。 

在 第 4.4 节 重 回 理论 分 析 。 尽 管 是 本 书 的 最 后 一 节 , 但 它 更 多 地 指示 
博弈 论 的 发 展 方向 及 更 新 和 更 深入 的 研究 领域 , 而 不 只 是 对 以 前 内 容 的 总 
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4.1 精炼 贝 叶 斯 均衡 概述 


考虑 如 下 完全 非 完 美 信息 动态 博弈 。 第 一 , 参与 者 1 在 3 个 行动 中 进 
行 选 择 一 一 L、M 及 尺 。 如 果 参 与 者 1 选择 R 则 博弈 结束 (不 等 参与 者 2 
行动 )。 如 果 参 与 者 1 选择 了 工 或 M, 则 参与 者 2 就 会 知道 1 没有 选择 民 
(但 不 清楚 1 是 选择 了 上 还 是 M) ,并 在 或 工 ' 或 中 "两 个 行动 中 进行 选择 , 博 
弈 随 之 结束 。 收 益 情 况 由 图 4.1.1 的 扩展 式 博弈 给 出 。 


逢 过 图 4.1.2 给 出 的 这 一 博弈 的 标准 式 表 述 , 我 们 可 以 发 现存 在 两 个 
纯 战 略 纳什 均衡 ( 工 , 工 ) 和 (及 , 尺 )。 为 确定 这 些 纳什 均衡 是 否 符 合子 博 蛮 
精炼 的 杀 御 ,我 们 先 明确 博弈 的 子 博弈 。 由 于 于 博弈 根据 定义 始 于 单一 信 
息 集 的 决策 节 ( 但 不 包含 博 穿 的 第 一 个 决策 节 ), 图 4.1.1 里 的 博弈 不 存在 
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THF. MR-PMEPFRA TES. 则 子 博弈 精炼 的 要 求 ( 具 体 地 说 , 即 参 
与 者 的 战略 在 每 一 个 子 博弈 中 均 构 成 纳什 均衡 7 自然 就 得 到 满足 。 从 而 在 
任何 汕 有 子 博弈 的 博弈 中 , 子 搏弈 精炼 纳什 均衡 的 定义 便 等 同 于 纳什 均衡 
的 定义 ,于 是 在 图 4.1.1 中 , (IL, 工 ) 以 及 (RR, Ro) ARSE TER ARA t 
H. RT. (KR,R') 却 又 明显 屡 依 赖 于 一 个 不 可 信和 的 威胁 ;如 果 轮 到 参与 者 
2 行动, 则 选择 L EATA R, 于 是 参与 者 1 便 不 会 由 于 2 威胁 他 将 在 
其 后 的 行动 中 选择 R, WEE Ro l 
ga — RE, 以 排除 图 4.1.1 PARR, ROTERE 
BASA Ae — EAA PAT Be. 

Eki: 在 每 一 信息 集中 , 应 该 行动 的 参与 者 必须 对 博弈 进行 到 该 售 
息 集 中 的 哪个 节 有 一 个 推断 (belieft)。 对 于 非 单 节 信息 集 , 推 断 是 在 信息 集 
中 不 同 节点 的 一 个 概率 分 布 ; 对 于 单 节 的 信息 集 , 参与 者 的 推断 就 是 到 达 此 
单一 决策 节 的 概率 为 1。 

要 求 2: #@#2BS AHEM, 参与 者 的 战略 必须 满足 序 嘻 理 性 (se- 
quentially rational) 的 要 求 。 即 在 每 一 信息 集中 应 该 行动 的 参与 者 (以 及 参 
与 考 随 后 的 战略 ), 对 于 给 定 的 该 参与 者 在 此 信息 集中 的 推断 , 以 及 其 他 参 
与 者 随后 的 战略 (其 中 “随后 的 战略 ”是 在 达到 给 定 的 信息 集 之 后 ,包括 了 其 
后 可 能 发 生 的 每 一 种 情况 的 完全 的 行动 计划 ) 必 须 是 最 优 反 应 。 

在 图 4.1.1 中 ,要 求 1 意味 着 如 果 博 讲 的 进行 达到 参与 者 2 的 非 单 节 
信息 集 , 则 参与 者 2 必须 对 具体 到 达 哪 一 个 节 ( 也 就 是 参与 者 工 选择 了 工 
还 是 尺 ) 有 一 个 推断 。 这 样 的 推断 就 表示 为 到 达 两 个 节 的 概率 和 1 一 p， 
OLED 4.1.3, 


图 4.1.3 


给 定 参 与 者 2 的 推断 , 选择 R’ 的 期 望 收益 就 等 于 p-0+ (1 - pl =2 
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— p, WAH LOW te SF p-1+(1-p)-2=2- p, HFMEBH 
p, BA 2- p>l— p 要求 2 就 排除 了 2 RARE TE, Mi, AIR 
简单 要 求 每 一 参与 者 持 有 一 个 推断 ,并 且 在 此 推断 下 选择 最 忧 行 动 , 就 足以 
使 我 们 排除 不 合理 的 均衡 (有 ,RD)。 

要 求 1 和 2 只 保证 了 参与 者 持 有 推断 .并 对 给 定 的 推断 选择 最 优 行动 ， 
但 并 没有 明确 这 些 推断 是 否 是 理性 的 。 为 进一步 约束 参与 者 的 推断 , 我 们 
需要 区 分 处 于 均 冤 路 径 上 的 信息 集 和 不 处 于 均 突 路 径 上 的 信息 集 。 


EX METH EHD RABE PK EHH, 如 果 博 弈 根据 均衡 
战略 进行 时 将 以 正 的 概率 达到 某 信 息 集 ,我 们 称 此 信息 集 处 于 均 街 路 径 之 上 
(on the equilibrium pathy。 反 之 ,如 果 铺 弈 根据 均衡 战略 进行 时 , 肯定 不 会 达 
到 某 信息 集 , 我 们 称 之 为 处 于 均衡 路 径 之 外 的 信息 集 (off the equilibrium 
path), (其 中 "均衡 "可 以 是 纳什 . 子 博 宅 精 炼 、 由 叶 斯 以 及 精 烽 贝 叶 斯 均衡 ) 


要 求 3: 在 处 于 均衡 路 径 之 上 的 信息 集中 , 推断 由 贝 叶 斯 法 则 及 参与 
者 的 均衡 战略 给 出 。 

例如 ,在 图 4.1.3 的 子 博 弈 精 堪 纳什 的 衡 ( 工 ,工人 ) 中 ,和 参与 者 2 的 推断 
一 定 是 p= :给 定 参 与 者 1 的 均衡 战略 ( 具 性 地 说 , 工 ), 参 与 者 2 知道 已 经 
到 达 了 信息 集中 的 哪 一 个 节 。 作 为 要 求 3 的 另 一 种 说 明 ( 假 定性 的 ), 设想 
在 图 4.1.3 中 存在 一 个 混合 战略 均衡 , 其 中 参与 者 1 选择 工 的 概率 为 gl， 
M 的 概率 为 92, 选择 R 的 概率 为 1- 9i- g2。 要 求 3 则 强制 性 规定 参与 者 
2 的 推断 必须 为 p= gq/(g1 + ez) 

要 求 1 到 3 包含 了 精炼 贝 叶 斯 均衡 的 主要 内 容 , 这 一 均衡 概念 最 为 闫 
键 的 新 的 特征 要 归功 于 克 雷 普 斯 和 威 尔 运 (1982) :在 均衡 的 定义 中 ,推断 被 
提高 到 和 战略 同等 重要 的 地 位 。 正 式 地 讲 , 一 个 均衡 不 青 只 是 由 每 个 参与 
者 的 一 个 战略 所 构成 ,还 包括 了 两 个 参与 者 在 该 他 行动 的 每 一 信息 集中 的 
一 个 推断 。? 通过 这 种 方式 使 参与 者 推断 得 以 明确 的 好 处 在 于 , 和 前 几 章 
中 我 们 强调 参与 者 选择 可 信 的 战略 一 样 , 现在 我 们 就 可 以 强调 参与 者 持 有 


FUER SA BR et A {sequential equilbrium) 的 定 交 ,对 均 守 的 这 一 特点 进行 
TRE ht, FR SEA PRS, ERASERS ee LT, 但 某 些 博 
PR, FRYERS L, BREN PHB SA OS Re. Br 
AB OLE REE LE BT SE — A He R HEE OCR A a T R 
A. CERMEN, 任意 的 有 了 很 博 弈 ( 即 所 有 有 限 侈 与 者 .类 型 有 限 , 可 能 的 行动 步 数 有 限 
的 宝 守 ) 都 有 序 贯 均衡 ,这 也 意味 着 在 任何 有 限 搬 纤 中 都 存在 情 才 页 时 斯 均 街 。 
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《后 面 的 要 求 4, 以 及 第 4,4 节 中 的 其 他 情况 )。 

在 简单 的 经 济 学 应 用 中 , 包括 第 4.2.A 节 的 信和 号 博弈 和 第 4.3.A 节 的 
空谈 博弈 要 求 1 到 3 不 仅 包 括 了 精炼 贝 叶 斯 博弈 的 主要 思想 , 而且 还 构 
成 了 它 的 定义 。 不 过 , 在 更 为 复杂 的 经 济 学 应 用 中 , 为 剔除 不 合理 的 均衡 ,还 
需 引 人 进一步 的 要 求 。 不 同 的 学 者 使 用 过 不 全 的 精炼 路 叶 斯 均衡 定 裕 ,所 有 
的 定义 都 包括 要 求 1 到 3, 绝 大 多 数 同 时 包含 了 蔓 求 4; 还 有 的 引入 了 更 进 一 
步 的 要 求 。P 本 章 我 们 用 要 求 1 到 4 作为 精 炬 贝 叶 斯 均衡 的 定义 。 包 

要 求 4: 对 处 于 均衡 路 径 之 外 的 信息 集 , 推断 由 贝 叶 斯 法 则 以 及 可 能 
情况 下 的 参与 者 的 均衡 战略 决定 。 


定义 ”满足 要 求 1 到 4 的 战略 和 推断 构成 博弈 的 精炼 贝 叶 斯 均衡 。 


MER 4 理 给 出 一 个 更 为 精确 的 表述 当然 会 有 助 于 我 们 理解 一 一 不 包 
含 较为 模糊 的 限定 语 “ 可 能 情况 下 ”, 在 其 后 各 节 的 经 济 学 应 用 分 析 中 我 们 
将 完成 此 项 工作 。 现 在 , 我 们 通过 图 4.1.4 和 4.1.5 中 的 三 位 参与 者 博弈 
来 说 明 并 理解 要 求 4 的 必要 性 (收益 值 中 , 上 、 中 ,下 分 别 表示 了 参与 者 1、 
2.3 的 收益 )。 

此 博弈 有 一 个 子 博弈 EM FASS 2M SPAR. KTS 
与 者 2 和 3 之 间 的 ) 惟 一 的 纳什 均衡 为 ( 工 , RF), FRETS HT 
弈 精炼 纳什 均衡 为 (万 ,上 , 民 )。 这 一 组 战略 和 参与 者 3 的 推断 请 = 1 满足 
了 要 求 1 到 要 求 3, 而 且 也 简单 地 满足 了 要 求 4, 因 为 没有 处 于 这 一 均 竹 路 
径 之 外 的 信息 集 , 于 是 构成 了 一 个 精炼 贝 叶 斯 均衡 。 

下 面 考 虑 战略 (A, 工 , LL ) 以 及 相应 的 推断 p =0。 这 组 战 路 是 一 个 纳 
慎 均衡 ,没有 参与 者 愿意 单独 偏离 这 一 结果 。 这 一 组 战略 及 推断 也 满足 要 


中 ”为 使 读者 对 要 求 1 到 4 之 放 的 因素 有 一 点 慨 访 ,假设 大 与 者 2 和 3 已 观测 到 同样 的 事件 ， 
并 都 观察 到 大 与 者 1 杭 离 了 均 裔 行为 。 在 参与 者 1 有 私人 信息 的 非 完 全 信息 博克 中 , 参与 者 2 和 和 3 
是 吾 还 应 对 参与 者 1 的 业 型 有 同样 的 推断 ? 在 完全 信息 博 穿 中 , SA 2 和 3 对 之 前 所 观察 到 的 
SSF 1 的 行动 是 和 否 应 桂 有 相同 的 推断 ? 相似 地 , 如 和 此 参与 者 和 3 已 观测 到 的 事件 相同 , 扒 后 参 
与 者 2 RET MATH, 参与 者 3 是 否 应 该 改变 他 对 参与 者 1 RAS, 或 改变 对 1 没 驶 察 到 的 
行动 的 推断 ? 

O 言 登 伯 格 和 奉 勒 尔 {1991) 对 非 完全 信息 动态 情 蛮 更 为 广泛 的 种 类 给 出 了 精炼 贝 叶 斯 均衡 
的 正式 定义 。 地 们 的 定义 强调 了 注 中 中 提 到 的 因素 。 不 过 ,在 本 合 分 析 的 简单 博弈 中 ,此 类 因素 不 
会 葵 涉 及 到 。 所 以 ,他 们 的 定义 等 价 于 要 求 1 到 4。 窜 登 伯 格 和 蒂 罗 尔 还 给 出 了 其 特 糠 贝 时 斯 均 瞻 
Ee Fe a Ae A a a PF Be, 
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4.1.4 


求 1 到 3, 参与 者 3 有 一 个 推断 并 根据 它 选 择 最 优 行动 。 但 是 ,这 一 纳什 询 
衡 却 不 是 子 博弈 精炼 的 , 因为 博弈 众 一 子 博弈 的 惟一 的 纳什 均衡 为 ( 工 ， 
RR ,这 也 说 明 要 求 1 到 3 并 不 能 保证 参与 者 的 战略 是 子 博 弈 精炼 纳什 列 
衡 。 和 问题 在 于 参与 者 3 的 推 斯 ( 户 =0) 与 参与 者 2 的 战略 ( 工 ) 并 不 一 致 ,但 
要 求 1 到 3 并 没有 对 3 的 推断 进行 任何 限制 ,因为 如 果 按 给 定 的 战略 进行 
博弈 将 不 会 到 达 3 的 信息 集 。 不 过 ,要求 4 强制 3 的 推断 决定 于 参与 者 2 
的 战略 :如果 2 的 战略 为 工 , 则 3 的 推断 必须 为 p =1; 如 果 2 的 战略 为 
FR, 则 3 的 推断 必须 为 p=0。 但 是 , 如果 3 的 推断 为 p =1, 则 要 求 2 又 
强制 3 的 战略 为 R, TERRA, L, LL ) 及 相应 推断 p = 0 不 能 满足 要 
求 1 到 4。 

为 进一步 理解 要 求 4, 假设 图 4.1.4 稍 作 改变 成 为 图 4.1.5: 现 在 参与 
者 2 多 出 了 第 三 种 可 能 的 行动 A’, 也 可 以 令 博 弈 结束 (为 使 表示 简化 ,这 一 
博弈 略 去 了 收益 情况 ?。 和 前 例 相 同 , 如 果 和 参与 者 1 Ay ae A, 则 参 
与 者 3 的 信息 集 就 处 于 均衡 路 径 之 外 , 但 现在 要 求 4 却 无 法 从 2 的 战略 中 
决定 3 的 推断 。 恕 果 2 的 战 格 为 A’, WER 4 就 对 3 的 推断 没有 任何 限 
制 , 伍 如 果 2 的 战 赂 为 以 g, 的 概率 选择 L, qa 的 概率 选择 坟 ,1 一 gi 一 gs 的 
概率 选择 A’, 其中, gi + 9z=0,. 则 要 求 4 就 限定 了 3 的 推断 为 p= glg 
+ g2)0 


在 本 节 的 最 后 ,我 们 非 正式 地 讨论 精 垮 贝 叶 斯 均衡 和 前 几 章 介绍 的 均 


Iss (ee awy 


FA 4.1.5 


衡 梳 念 的 关系 。 在 纳什 均衡 中 ， 每 一 参与 者 的 战略 必须 是 其 他 参与 者 战 
略 的 一 个 最 优 反应 ， 于 是 没有 参与 者 会 选择 严格 劣 战略 。 在 精 笑 贝 叶 
斯 均衡 中 ， 要 求 1 和 2 事实 上 就 是 要 保证 没有 参与 者 的 战略 是 始 于 和 任 
MY—-PMABRHARE. (BRB 4.4 节 给 出 的 始 于 一 个 信息 集 的 劣 战 
BS AA) TE RE SL) 纳什 均衡 及 贝 叶 斯 纳什 均衡 对 处 于 均衡 路 径 之 外 的 信 
息 柴 则 没有 这 方面 的 要 求 ， 即 使 是 子 博 旗 精 炼 纳什 均衡 对 某 些 处 于 均 
衡 路 径 之 外 的 信息 集 也 没有 这 方面 的 要 求 ， 比 如 对 那些 不 包 舍 在 任何 
FRA ARTE BR. MDL Kt kM: 参与 者 不 可 以 
Be Pa AE M t FERA ST BAB a a B R E F a e f 
之 外 。 

正如 前 面 讲 过 的 , 精炼 中叶 斯 均 生 这 一 概念 的 优点 之 一 ,就 是 它 使 得 参 
与 者 的 推断 明确 化 了 ,从 而 使 我 们 可 以 引入 要 求 3 和 4 以 及 更 进一步 的 要 
求 !( 对 处 于 均衡 路 径 之 外 的 推断 )。 由 于 精炼 责 叶 斯 均衡 排除 了 参与 者 ; 选 
择 任何 始 于 处 于 均衡 路 径 之 外 信息 集 的 严格 步 战略 的 可 能 性 , 要 令 参 与 者 
了 相信 i 会 选择 这 样 一 个 战略 当然 也 是 不 合 情 理 的 。 不 过 , 精炼 贝 时 斯 均衡 
使 得 参与 者 的 推断 明确 化 了 。 这 种 均衡 往往 不 能 沿 博弈 树 通 过 道 向 推导 而 
构建 出 来 , 像 我 们 构建 子 博 弈 精炼 纳什 均衡 时 采用 的 方法 一 样 。 要 求 2 决 
定 了 参与 者 在 一 个 给 定 信 息 集 的 行动 部 分 依赖 于 参与 者 在 该 信息 集 的 推 
断 , 如 果 在 这 一 信息 集 还 同时 适用 于 要 求 3 或 者 要 求 4, 则 参与 者 的 推断 又 
由 其 他 参与 者 在 博弈 树 更 上 旺 的 行动 所 央 定 。 但 是 根据 要 求 2, 这 些 在 博 
弈 树 更 上 端的 行动 又 部 分 依赖 于 参与 者 随后 的 战 栈 , 包 括 在 当初 信息 集 的 
行动 。 这 一 循环 推论 意味 着 沿 博弈 树 从 后 向 前 逆向 推导 (一 般 铺 况 下 ) 将 不 
足以 计算 出 精炼 天 叶 斯 均衡 。 
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4.2 信号 博弈 


4.2.A 信号 博弈 的 精炼 共 叶 斯 均衡 


信和 号 博弈 是 两 个 参与 者 之 间 的 非 客 全 信息 动态 博弈 :信号 发 送 者 
{Sender，S) 和 信号 接收 者 (Receiver，R), 博弈 的 时 间 顺 序 如 下 : 
1. 自然 根据 特定 的 概率 分 布 piri), 从 可 行 的 类 型 集 工 = jipet P 
厂子 发 送 者 某 种 类 型 ,这 里 对 所 有 的 i, pin) >00 FFA pldt 
+ plty=1; 

2. 发 送 者 观测 到 o, 然后 从 可 行 的 信和 号 集 M = |m m PRE 
个 发 送信 号 mj; 

3. 接收 者 观测 到 sm;( 但 不 能 观测 到 2), 然后 从 可 行 的 行动 集 4 1ai， 
,art 中 选择 一 个 行动 aps 

4. 双方 收益 分 别 由 zf mj, a.) w(t mj, 24) 给 出 。 

在 许多 应 用 中 , 可行 集合 T、M 及 有 A 为 实数 轴 上 的 区 间 , 而 不 是 上 面 
考虑 的 有 限 集 。 而 允许 可 行 的 信 叶 和 集 依 赖 于 自然 赋予 的 类 型 , 可行 的 行动 
集 又 依赖 于 发 送 者 选择 的 信号 的 情况 也 十 分 容易 理解 。 

入 号 模型 已 被 十 分 广泛 地 应 用 于 经 济 学 领域 。 为 说 明 其 潜在 应 用 的 广 
tk, 我 们 把 将 在 第 4.2.B 和 第 4.2.C 节 分 析 的 三 个 应 用 套用 1 一 4 式 的 
规范 结构 简 述 如 下 ， 

在 斯 豆 斯 (1973) 的 劳动 力 市 场 模型 中 , 发送 者 是 一 个 求职 的 工人 ， 
接收 者 是 潜在 的 雇主 市 场 ,类 型 为 工人 的 生产 能 力 , 信号 是 工人 对 教育 
的 选择 ,行动 是 市 场 支 付 的 工资 。 

在 迈 尔 斯 和 迈 卢 夫 (1984) 的 公司 投资 和 资本 结构 模型 中 , 发 送 者 
为 要 为 一 个 新 项 目 融资 的 企业 ,接收 者 为 潜在 的 投资 者 ,类 型 为 现存 资 
产 的 重 利 能 力 , 信 号 为 企业 为 所 融资 金 承诺 的 权益 份额 ,行动 则 是 投资 
者 就 是 否 投 资 作出 的 决定 。 

在 一 些 应 用 中 ,信号 博弈 被 融 于 内 容 更 为 丰富 的 博弈 之 中 。 例 如 ,在 第 
二 步 发 送 者 选择 信和 号 之 前 ,接收 者 可 能 会 有 一 个 行动 ,或 是 在 第 四 步 接收 者 
选择 行动 之 后 (或 当时 ) 发 送 者 会 有 一 定 的 行动 。 

在 维 克 斯 (1986) 的 货币 政策 模型 中 , 联邦 慷 备 局 享有 的 私人 信息 
是 其 为 怪 进 就 业 而 愿意 接受 的 通货 膨胀 水 平 , 其 他 的 条 人 忻 与 第 2.3.E 
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节 分 析 的 完全 信息 重复 博弈 完全 相同 , 不 过 只 包含 两 个 阶段 。 这 样 ,发 
送 者 为 联储 当局 ,接收 者 为 就 业 市 场 ,类 型 为 联 情 为 促进 就 业 而 络 意 接 
” 受 的 通胀 水 平 , 信号 为 联储 对 第 一 期 通胀 的 选择 , 行动 为 雇主 们 对 第 二 

期 通胀 的 预期 。 雇 主 们 对 第 一 期 通胀 的 预期 发 生 在 信 生 博弈 之 前 , 联 

悄 对 第 二 期 通胀 水 平 的 选择 则 在 其 后 。 

本 节 的 其 余部 分 暂 不 分 析 上 面 列 举 的 应 用 模型 ,而 集中 研究 1 一 4 给 出 
Ay ase WS SSE, 图 4.2.1 给 出 了 一 种 简单 情况 的 扩展 式 表 述 ( 不 考 虚 收 
ee tO): T= lti to), M = |m mol, A= lanaz., Æ Proble,} = po 
EE, RERA TEAR DOM KEIR PRB AD, 
而 是 从 树 中 间 自 然 的 初始 行动 依次 进行 到 左右 两 端的 终点 节 。 

前 面 已 讲 过 (在 任何 搏弈 中 ) 参 与 者 的 一 个 战略 是 行动 的 完整 计划 一 一 
战略 包含 在 可 能 避 到 的 每 一 种 情况 下 参与 者 将 选择 的 行动 。 因 而 在 信号 博 
Fh, 发送 者 的 一 个 纯 战 略 是 函数 mt) ,明确 发 送 者 为 自然 可 能 赋予 的 每 
一 种 类 型 时 ,将 选择 的 信号 ;接收 者 的 一 个 纯 战 略 则 是 西数 a(mj), 指明 对 
发 送 者 可 能 会 发 出 的 每 一 种 信号 将 选择 什么 行动 。 在 轿 4.2: 1 的 简单 博弈 
中 , 发送 者 和 接收 者 都 有 四 个 纯 战 略 。 


Bg 4.2.1 


发 送 者 战略 1: 如 果 自 然 赋 于 类 型 ,选择 和 信和 号 m1 ;如果 自然 赋予 类 型 
to 选择 信号 mis; 

发 送 者 战略 2, RAR zt1, 选择 mr; 如 果 自 然 岂 对 to, 选择 m2; 
发 送 者 战略 3 IR HEHE mo RART 22, 选择 m; 
发 送 者 战略 4: 如 果 自 然 赋予 tj, 选择 mm xz; 如果 自然 赋予 和 ,选择 m2. 
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接收 者 战略 1; 如 果 发 送 者 选择 信号 mi 选择 行动 ai; 如 果 发 送 者 选择 

信号 ma 选择 行动 sli 

接收 者 战略 2: 如 果 发 送 者 选择 mo 选择 ci; 恕 果 发 送 者 选择 ma, 选 

择 azi 

接收 者 战略 3: 如果 发 送 者 选择 mz1, 选择 sz; 如 果 发 送 者 选择 ma, Ë 

择 ais 

接收 者 战略 4: 如 果 发 送 者 选择 mi, 选择 as; 如果 发 送 者 选择 m2, 选 

择 Azo . 

我 们 称 发 送 者 的 第 1 和 第 4 战略 为 混同 (pooling) 战 略 ,因为 在 不 同类 
型 时 都 发 出 相同 的 信和 号。 在 多 于 两 种 类 型 的 模型 中 还 存在 部 分 混同 (par- 
tially pooling)( 准 分 离 (semi-separating)) 战 略 , 其 中 所 有 属于 给 定 类 型 集 的 
类 型 都 发 送 同样 的 信和 叶 , 但 不 同 的 类 型 集 发 送 不 同 的 信号 。 在 图 4.2.1 的 
两 类 型 博弈 中 也 存在 与 混合 战略 相 类 似 的 战略 , 称 为 杂 人 各 战略 {hybrid 
strategies) :比如 说 类 型 二 选择 和 ma, 但 类 型 ?> 却 随 桃 选择 mm 或 me 

现在 ,我 们 把 第 4.1 节 中 关于 要 求 1 到 3 的 一 般 性 表述 转化 为 信号 博 
弈 中 对 精炼 贝 叶 斯 均衡 的 正式 定义 { 对 图 4.1.5 的 讨论 说 明了 要 求 4 对 信 
号 博弈 是 没有 意义 的 )。 为 使 问题 简化 , 我 们 只 讨论 钝 战略 。 杂 合 战略 在 下 
一 节 分 析 就 业 市 场 信号 时 再 给 以 简要 介绍 。 至 于 如 和 何 一 般 性 定义 信和 叶 博 弈 
中 的 贝 叶 斯 纳什 均衡 , 我 们 留 作 习 题 ,请 自己 练习 ,参见 习题 4.6。 

因为 发 送 者 在 选择 傅 号 时 后 道德 弈 进行 的 全 过 程 , 这 一 选择 发 生 于 单 
节 信息 集 (对 自然 可 能 赋予 的 每 一 种 类 型 都 存在 一 个 这 样 的 信息 集 )。 从 
而 , 要求 1 在 应 用 于 发 送 者 时 就 无 需 附 加 任何 条 件 ;相反 ,接收 者 在 不 知道 
发 送 者 类 型 的 条 件 下 观测 到 发 送 者 的 信和 号 ,并 选择 行动 ,也 就 是 说 接收 者 的 
选择 处 于 一 个 非 单 节 的 信息 集 { 对 发 送 者 可 能 选择 的 每 一 种 信号 都 存在 一 
个 这 样 的 信息 集 , 而 且 每 一 个 这 样 的 信息 集中 ,各 有 一 个 节 对 应 于 自然 可 能 
赋 子 的 每 一 种 类 型 )。 把 要 求 1 应 用 于 接收 者 可 得 到 : 

信号 要 求 1 在 观测 到 M 中 的 任何 信号 mi 之 后 ,接收 者 必须 对 哪些 
类 型 可 能 会 发 送 mi 持 有 一 个 推断 。 这 一 推断 用 概率 分 布 u(ri| mM, 
其 中 对 所 求 工 中 的 ultim 0 A 


tT 
给 定 发 送 者 的 信号 和 接收 者 的 推断 ,再 描述 搂 收 者 的 最 优 行为 使 十 分 简单 ， 


把 要 求 2 应 用 于 接收 者 可 以 得 到 : 
信号 要 求 2R 对 M 中 的 每 一 m, 并 在 给 定 哪些 类 型 可 能 发 送 m; 的 


I48 BSE HO EAE 


推断 u(r, | mm) 的 条 件 下 , 接收 者 的 行动 v*(m)) 必 须 使 接收 者 的 期 望 效用 
最 大 化 。 亦 即 a (m) H FRK 
maxUs(2;, mja’ (m,)) 

BOR 2 同样 适用 于 发 送 者 , 但 发 送 者 有 完全 信息 (及 由 此 而 来 的 单纯 推断 )， 
并 且 只 在 博弈 的 开始 时 行动 ,于 是 要 求 2 相对 比较 简单 :对 给 定 的 接收 者 的 
RE, EAREN IES OD BR, 

信号 要 求 25 WT 中 的 每 一 4, 在 给 定 接收 者 战略 e* (m,) RE 
下 ,发 送 者 选择 的 信号 m (21) 必须 使 发 送 者 的 效用 最 大 化 。 亦 即 m” C) 
为 下 式 的 解 


max Uslt,, ma (mj). 


最 后 ,给 定 发 送 者 的 战略 m) F T 表示 选择 发 送 者 信号 mi 的 类 
型 集合 ,也 就 是 说 , 如果 四 Ct om, We, AT, PRK. WE T, 不 是 
空 集 , 则 对 应 于 信号 m, 的 信息 集 就 处 于 均衡 路 径 之 上 ;否则 ,任何 类 型 都 
不 选择 zi, 其 对 应 的 信息 集 则 处 于 均衡 路 径 . 之 外 .对 处 于 均衡 跨 径 上 的 信 
号 ,把 要 求 3 运用 于 接收 者 的 推断 , 可 以 得 到 ; 
ESER; 对 每 一 M 中 的 mm 如 果 在 T PEE, Efm”) 
mi 则 接收 者 在 对 应 下 mi 的 信息 集中 所 持 有 的 推断 必须 决定 于 贝 叶 斯 法 
则 和 发 送 者 的 战略 : 
_ ple 
ulel my) PrE 


EX ASRA P72 A Ty Tom "(1;) 和 
a” Cm LAR FER u(i) mj), EPS BRO), (R), (28) R43). 


ta SR Ae BY RU] AR, RIRA a a A 
的 。 

在 本 节 的 最 后 , 我 们 求解 图 4.2.2 中 两 类 型 博弈 的 纯 战 略 精炼 出 叶 斯 
均衡 。 请 注意 这 里 自然 赋 于 每 一 类 型 的 可 能 性 是 相等 的 ,我们 分 别 用 (p,1 
一 户 } 和 (gq,1 一 9g) 表示 接收 者 在 其 两 个 信息 集 内 的 推断 。 

这 一 两 类 型 两 傍 号 博弈 有 4 个 可 能 的 纯 战 略 精炼 贝 叶 斯 均衡 :(1)7 混 
同 于 工 ;(2) 混 同 于 RO), a AF L, n 选择 尺 ;及 (4) 分 离 , ti 选择 
Rito 选择 上 。 我 们 依次 分 析 这 四 种 可 能 性 。 
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图 4.2.2 


1. RAF L: BERRE THA, 发 送 者 的 战略 为 ( 工 , L) AE m, 
mm) ARR 2, 选择 m ,类 型 zz 选择 mx”。 则 接收 者 对 应 于 工 的 信息 和 集 
处 于 均衡 路 径 之 上 ,于 是 接收 者 在 这 一 信息 集 内 的 推断 (p,1- 户 ) 决 定 于 由 
叶 斯 法 则 和 发 送 者 的 战略 :p=0.5, 也 就 是 先 验 分 布 。 给 定 这 样 的 推断 ( 事 
实 上 或 者 任何 其 他 推断 ), 接收 者 在 上 之 后 的 最 优 反 应 为 选择 wx, 于 是 类 型 
zl 和 类 型 :; 的 发 送 者 分 别 可 得 到 的 收益 为 1 和 2。 为 确定 是 否 两 种 类 型 
的 发 送 者 都 愿意 选择 工 ,我 们 需要 明确 对 RR 接收 者 将 如 何 反 应 。 如 果 接 收 
者 对 R 的 反应 为 x, 则 类 型 2 AFR 的 收益 等 于 2, 它 高 于 1 选择 工 的 收 
ii 1。 但 如 果 接 收 者 对 R 的 反应 为 d, 则 通过 选择 R, ti 和 oe, 的 收益 将 (分 
别 ) 为 0 和 1, 而 他 们 选择 工 却 可 分 别 获得 1 和 2。 那么 ,如果 存 在 一 个 均 
衡 , 其 中 发 送 者 的 战略 为 ( 工 , 工 ), WEEKE R 的 反应 必须 为 了 ,于 是 接收 
者 的 战略 必须 为 (4, 4), 这 里 (a', a”) 表 示 接 收 者 在 上 ZR a’, ÆR 
之 后 选择 a”"。 另 外 ,还 需要 考虑 接收 者 在 对 应 于 R 的 信息 集中 的 推断 , 以 
及 给 定 这 一 推 斯 时 选择 4 是 否 是 最 优 的 。 由 于 对 接收 者 当 og 所 2/3 时 选择 
d 为 最 优 的 ,我们 得 到 [( 工 , 工 ), Cu, d), p=0.5, gq], 对 任意 的 g 志 2/3 为 博 
塞 的 泥 同 精炼 贝 叶 斯 均衡 。 

2. 混同 于 玉 :; 下 面 假 设 发 送 者 的 战略 为 (RR, R), Mg =0.5, 于 是 接收 
者 对 R 的 最 优 反应 为 4, 类 型 二 和 本 分 别 得 到 的 收益 为 0 和 1。 但 ! 选 
FEL 可 得 到 收益 1, 因为 对 任意 p 值 ,接收 者 对 工 的 最 做 反应 都 是 ,于 是 
NE RIERA RB ACR, ROWE. 

3. 分 离 ,5 选择 工 :如 果 发 送 者 选择 分 高 战略 ( 工 , 民 ), 则 接收 者 的 两 


150 SFP Hae RY 


个 信息 集 都 处 于 均衡 路 径 之 上 , 于 是 两 个 推断 都 决定 于 贝 叶 斯 法 则 和 发 送 
者 的 战略 ;p=1,g=0。 接 收 者 在 此 推断 下 的 最 优 反 应 分 别 为 x Md. FB 
两 种 类 型 的 发 送 者 获得 的 收益 都 是 1。 另 外 , 还 需 检验 对 给 定 的 接收 者 战 
lu, d), 发送 者 的 战略 是 咨 是 最 优 的 。 结 果 是 否定 的 :如 果 类 型 ta 不 选 
择 工 ,而 选择 只 , 则 接收 者 反应 为 u 时 ,ta 可 获得 的 收益 为 2, 超过 其 选择 
R 时 的 收益 1。 

4. 分 离 , zi 选择 民 ; 如 果 发 送 者 选择 战略 (R, 工 ), 列 接 收 者 的 推断 必 
须 为 = 0, 9 =1, 于 是 接收 者 的 最 优 反应 为 (w, ww), 两 种 类 型 的 发 送 者 都 可 
得 到 2 的 收益 。 如 果 n 想 偏 离 这 一 战略 而 选择 L, 则 接收 者 的 反应 将 会 为 
u, 则 2, 的 收益 将 减 为 1 于 是 没有 任何 动机 偏离 Re ASD, 如果 i 想 
贪 离 这 一 战略 面 选择 R, 则 接收 者 的 反应 将 为 ,ta 的 收益 将 减 为 1, 于 是 
t 也 没有 任何 动机 偏离 上。 从 而 ER, 工 ), (Cu, u) pe 一 0,9=1] 为 博弈 分 离 
的 精炼 贝 叶 斯 均衡 。 


4.2.B 就 业 市 场 信 号 


甘于 信和 号 博弈 的 大 规 草 深入 研究 始 于 斯 朝 斯 (1973) 的 模型 , 该 模型 不 
仅 开 创 了 广泛 运用 扩展 式 博弈 描述 经 济 问题 的 先河 , 还 较 时 给 出 了 如 精炼 
册 时 斯 均衡 等 均衡 概念 的 定义 。 本 节 中 我 们 通过 扩展 式 博 弈 介绍 斯 豆 斯 的 
模型 , 并 描述 它 的 一 些 精 卉 员 时 斯 均衡 解 ,在 第 4.4 节 我 们 将 进一步 精炼 后 
的 精炼 贝 叶 斯 均衡 应用 于 这 一 博弈 。 时 间 顺 序 如 下 : 
1. 自然 决定 一 个 工人 的 生产 能 力 六 ‘EB AERC) REAR, = 
H MRR Ag. 
2. 工人 认识 到 自己 的 能 力 ,并 随后 选择 一 个 教育 水 平 e0. 
3. 两 个 企业 观测 到 工人 的 教育 水 平 (而 不 是 工人 的 能 力 ), 并 同时 向 工 
人 给 出 一 个 工资 水 平 的 出 价 - 忠 
4. CABS PREP LH, EHS MRE. Sw 
表示 工人 接受 的 工资 水 平 。 
工人 的 收益 为 tw -eye 其 中 ce) 是 能 力 为 y 的 工人 得 到 教育 e 
所 花费 的 成 本 ;企业 的 收益 为 yig, ej- w, AP yig ce) RRBAA vn HF 
且 教 育 水 平 为 e 的 工人 的 产 出 ;没有 凑 到 工大 的 企业 收益 为 0。 
我 们 (在 本 节 及 第 4.4 节 更 进一步 的 讨论 中 ) 将 集中 干 一 个 特定 的 精炼 


中 ”在 接收 者 一 方 出 现 了 两 个 企业 这 一 点 司 此 博弈 与 前 一 节 分 析 的 博弈 类 型 和 有 不 同 , 但 请 
参见 等 式 {(4.2.13? 之 前 的 有 关 讨 论 。 
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UHRA, 其 中 企业 把 教育 水 平 解释 为 关于 能 力 的 一 个 信号 ,从 而 给 受过 
更 高 教育 的 工人 开 出 更 高 的 工资 。 斯 彭 斯 (1973) 论 文 稍 显 不 是 的 一 点 在 
于 ,即使 教育 对 于 生产 率 完 全 没有 任何 影响 ( 即 ,即使 能 力 为 了 的 工人 产 出 
等 于 y(7), 和。 完全 无 关 ), 工 资 也 可 以 据 此 随 教育 程度 的 提高 而 提高 。 斯 
朝 斯 (1974) 的 论文 又 全 其 论证 更 为 一 般 化 , 允许 产 出 不 仅 可 能 随 能 力 而 提 
高 ,还 可 能 随 教育 而 提高 ;类 似 的 结论 从 而 变 为 工资 随 教育 而 提高 的 幅度 ， 
大 于 教育 对 生产 率 的 促进 可 以 解释 的 水 平 。 我 们 洪 用 后 面 更 为 一 般 的 方 
wv 

在 学 校 读书 时 间 更 长 的 工人 , 其 工资 也 更 高 (平均 而 言 ) 已 戒 为 广泛 接 
受 的 事实 (作为 一 个 例子 ,参见 要 塞 尔 (Mincer, 1974)。 这 一 事实 也 使 得 用 
在 学 校 读书 的 时 间 来 表示 变量 e 成 为 首选 。 在 分 离 均 衡 中 , 我 们 可 以 想象 
为 能 力 较 低 的 工人 只 读 到 商 中 毕业 , 能 力 较 高 的 工人 则 完成 了 大 学 教育 。 
但 不 幸 的 是 ,把 e 解释 为 学 校 教育 的 时 间 将 引起 1- 4 的 简单 博弈 中 没有 涉 
及 到 的 动态 问题 , 比如 在 工人 大 学 一 年 级 毕业 时 { 即 在 能 力 较 低 的 工人 根据 
假设 离开 学 校 之 后 ,而 在 能 力 较 高 的 工人 梳 据 概 设 离开 学 校 之 前 )} 企 业 向 其 
开 出 工资 的 可 能 性 。 在 更 为 丰富 的 模型 中 , 工人 可 以 在 每 一 年 选择 是 接受 
当年 所 给 出 的 最 高 工资 出 去 工作 . 还 是 继续 读书 , 第 二 年 再 进行 选择 。 内 尔 
德 克 (Noldeke} 和 范 : 达 默 (Van Damme, 1990) 分 析 了 属于 上 面 类 型 的 更 为 
直 富 的 博 斌 ,并 证 明 ;(i) 存 在 多 个 精炼 贝 叶 斯 均衡 ; (ii 通过 和 我 们 将 在 第 
4.4 节 运用 的 再 精炼 方法 非常 相近 的 精炼 之 后 , 只 有 一 个 均衡 存留 下 来 :以 
及 (Gi 站 这 一 存留 的 均衡 与 1 一 4 中 简单 博弈 通过 第 4.4 节 再 精炼 之 后 的 惟 
一 均衡 完全 相同 。 从 而 ,在 1 一 4 的 简单 博弈 中 , 我 们 也 可 以 不 太 严 格 地 把 
e 看 成 学 校 教育 的 时 间 , 因为 在 更 为 丰富 的 博弈 中 的 结果 是 一 致 的 。 

不 过 ,在 这 里 我 们 将 把 。 的 差异 解释 为 学 生 在 学 校 里 表现 的 差异 , 而 不 
是 学 生 接受 党校 教 育 时 间 的 差异 , 从 而 绕 过 上 面 的 动态 问题 。 据 此 , 1 一 4 
的 博弈 就 可 以 运用 于 一 组 高 中 毕业 生 { 即 接受 整整 12 年 教育 的 工人 ), 或 一 
组 大 学 毕业 生 或 MBA。 在 这 种 解释 下 , e 衡量 所 学 课程 的 门 数 及 种 类 、 在 
固定 的 教育 期 内 取得 的 学 分 质量 和 赢得 的 荣誉 等 。 学 费 支 出 (如 果 有 的 话 ) 
从 而 和 e 不 再 相关 ,于 是 成 本 函数 ciy ee) 量度 非 货币 的 (或 精神 的 ) 成 本 ， 
在 给 定 的 学 校 中 ,能 力 较 低 的 学 生发 现 要 取得 好 成 绩 覃 加 困难 ,同时 在 一 所 


D 正式 地 , 我 们 急 定 高 能 力 的 工人 有 于 高 的 生产 率 { 即 对 每 一 <,y(H,e) > (Lae), FAM 
痛 并 不 会 使 生产 率 降低 { 即 对 所有 的 y 和 所 有 的 <, yip 020, 其 中 因 (ae) 表 示 能 力 为 了 教育 水 
F He 的 工人 进一步 教育 的 边际 生产 率 )。 
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玩具 竟 争 力 的 学 校 中 要 得 到 相同 的 分 数 也 更 加 困难 。 用 教育 以 此 种 方法 作 
为 一 个 信和 号 也 可 以 说 明 下 面 的 事实 :企业 扇 佣 给 定 学 校 中 最 好 的 毕业 生 和 
最 好 学 校 的 毕业 生 , 并 支付 他 们 更 高 的 工资 。 

斯 彭 斯 的 模型 中 最 关键 的 假定 是 较 低 能 力 的 工人 发 出 同样 的 伪 导 要 出 
较 高 能 为 工人 花费 的 成 本 高 ,更 为 精确 地 , 较 途 能 力 工 人 受 教育 的 边际 成 本 
要 高 于 较 高 能 力 工 人 :对 所 有 e 

e(Lie)>e(H.e) ， 

其 中 c,(w,e) 表 示 能 力 为 pR AKFA e 的 工人 进一步 教育 的 边际 成 本 。 
为 解释 这 一 假定 ,考虑 一 个 教育 水 平 为 ei HLA, 其 工资 水 平 为 w, 如 图 
4.2.3 所 示 , 并 计算 这 一 工人 的 教育 水 平 要 从 el 提高 到 e, 需要 相应 提高 多 少 
工资 才能 够 得 到 补偿 。 答 案 决 定 于 工人 的 能 力 : 低 能力 的 工人 发 现 要 本 得 更 
高 的 教育 较为 困难 ,于 是 就 需要 工资 增 吉 得 更 高 些 ( 增 加 到 zw ,而 不 是 只 增 
加 到 zwp), 直 足以 补偿 他 的 努力 。 这 一 假定 用 图 形 表 示 就 是 低能 力 工大 的 元 
差异 曲线 较 高 能 力 工 人 更 为 陡 靖 一 一 -比较 图 中 前 I, 和 I。 


& €2 


图 4.2.3 


斯 赣 斯 同时 还 假定 企业 之 间 的 竞争 可 使 期 望 利润 赵 于 0。 在 我 们 的 模 

型 中 建立 这 一 假定 的 方法 之 一 ,是 把 第 (3) 阶 段 的 两 个 企业 用 市 场 这 一 单一 
参与 者 代替 , 它 给 出 单一 的 工资 要 约 w, 并 得 到 收益 一 [y(,e) 一 zw POR 
过 这 种 转换 可 使 模型 属于 前 一 节 定 六 的 单一 接 收 者 信和 号 博 宅 )。 为 最 大 化 
其 期 望 收益 ,根据 信和 号 要 求 2R 的 要 求 ,对 给 定 的 市 场 在 观测 到 e 之 后 关于 
工人 能 力 的 推断 ,市场 的 工资 要 约 将 等 于 教育 水 平 为 e 的 工人 的 期 望 产 出 : 
wled=_CHledey€H. ed) +(1- py(Hle)ly(L,e), (4.2.1) 

其 中 z 下 |e) 表 示 市 场 断定 的 工人 能 力 高 的 概率 。 硅 阶段 (3), 直接 分 析 有 
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两 个 企业 相互 竞争 性 她 开 出 工资 要 约 , HS, a 
于 称 之 为 市 场 的 虚拟 参与 者 。 不 这 ,为 保证 企业 将 永远 开 出 等 于 工人 期 望 
产 出 的 工资 ,我 们 还 需要 加 上 另 一 很 定 ;: 观 测 到 教育 选择 e 之 后 ,两 企业 持 
有 关于 工人 能 力 的 推断 是 相同 的 , 我 们 仍 用 py( 太 1e) 表 示 。 由 于 信号 要 求 
3 快 定 了 在 观测 到 处 于 均衡 路 径 之 上 的 e 后 ,两 企业 必须 持 有 的 推断 , 我 们 
的 假定 事实 上 就 是 要 求 在 观测 到 不 处 于 均 竺 路径 上 的 se 被 选择 后 , 两 企业 
所 持 有 的 推断 仍然 相同 。 在 这 一 假定 下 , 可 以 进而 得 到 在 任何 精炼 贝 叶 斯 
均衡 中 ,两 企业 给 出 的 工资 要 约 都 为 (4.2.1) 中 的 wle), ERS 1.2.B 节 
的 贝 特 兰 德 模型 ,两 企业 的 报价 都 等 于 产 出 的 边际 成 本 。 从 而 , 在 本 节 的 两 
接收 者 模型 中 (4.2.1) 就 可 以 替代 相 了 要求 2 尺 。 

作为 分 析 这 一 信号 博弈 的 精炼 区 叶 斯 均衡 的 准备 ,我们 首先 考虑 和 空 
对 应 的 完全 信息 博弈 。 也 就 是 说 , 我 们 暂时 假定 工人 的 能 力 在 所 有 参与 者 
之 间 是 共同 知识 ,而 不 只 是 工人 的 私人 信息 。 在 这 种 情况 下 ,前段 (3) 两 企 
ib fa] SE SR SE yp BRACE e 的 工人 可 得 到 工资 zfe)=y 
Cy e) 从 而 能 力 为 5 的 工人 选择 满足 下 式 的 e: 

max yt ge)—clyse). 

M oe” (7) 雪 示 最 优 解 , 如 图 4.2.4 所 示 , 并 令 we) = yl, ey) o 


w 能 力 为 ?的 
SHR 


e*in e 


Fl 4.2.4 


现在 ,我 们 (永远 地 ) 回 到 工人 的 能 力 是 私人 信息 的 假定 。 这 所 性 了 一 - 
种 可 能 性 , 即 低能 力 的 工人 冒充 为 高 能 力 的 工人 , 从 而 可 能 会 发 生 两 种 情 
况 。 图 4.2.5 表示 的 情况 为 ,对 低能 力 工 人 来 讲 要 得 到 教育 水 平 e* {万 ) 所 
花费 的 成 本 过 高 ,即使 可 骗取 企业 相信 该 工人 是 高 能 力 的 并 可 得 到 工资 
w"{H), We BEE. UR, 在 图 4.2.5 P, wL- efL, e” 
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(Ljl>w"(H)-clL,e*CH)1. 


yiL e) 


e"{D) e*(H) 


4.2.5 


E 4.2.6 则 表示 了 相反 的 情况 , 我 们 可 以 把 这 种 情况 理解 为 低能 力 的 
工人 嫉妒 高 能 力 工人 在 完全 信息 条 件 下 的 工资 和 教育 水 平一 一 也 就 是 说 ， 
w"(E)~c[L,e*(L))<w"*(H)-e¢[L,e" (A). 后 一 种 情况 即 更 如 现 
实 , 而 且 ( 正 如 我 们 将 看 到 的 ) 更 加 有 趣 。 在 工人 的 能 力 不 限于 两 个 值 的 模型 
中 ,前 一 种 情况 只 有 当 每 一 可 能 的 能 力 什 都 和 其 相 邻 的 可 能 值 有 是 够 差异 时 
才 可 能 发 生 。 例 如 ,如果 能 力 是 一 个 连续 变量 , 则 就 适用 于 后 一 种 情况 。 


yiL, e) 


e"(L) e*(H)} 


4.2.6 


和 前 一 节 描述 的 相同 , 这 一 模型 可 以 存在 3 类 精 炬 贝 叶 斯 均衡 :混同 、 
分 离 以 及 杂 合 ,每 一 类 均衡 的 存在 都 十 分 广泛 , 我 们 只 集中 讨论 几 个 例子 。 
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在 两 种 类 型 的 工人 都 选择 单一 的 教育 水 平 e 的 混同 均衡 中 , 根据 信号 要 求 
3, 企业 在 观测 到 e, 之 后 的 推断 必须 等 于 其 先 验 推断 , jy (Hep) = 9, 这 又 
意味 着 在 观测 到 e, 之 后 给 出 的 工资 要 约 必须 为 
l wp=grylH,e,)+ 1-—aqh (Lie) - (4.2.2) 
为 完成 对 这 一 泥 同 精炼 贝 叶 斯 均衡 的 拱 述 ,还 必须 (i) 对 不 属于 均衡 教育 选 
择 的 e 关 2,, 明确 企业 的 推断 p (Hie), 它 又 可 通过 {4.2.1) 决 定 企 业 战 略 
w{e) 的 其 余部 分 ,以 及 ( 记 证 明 两 种 类 型 的 工人 人 对 企业 战略 w(e) 的 最 优 
.反应 都 是 选择 e = es, 这 两 步 分 别 代表 了 信号 要 求 1 和 2S; 前 面 还 已 提 到 ， 
{4.2.1) 在 这 一 两 接收 者 模型 中 代表 了 信号 要 求 2R。 
一 种 可 能 情况 是 企业 推断 任何 不 等 于 e, 的 教育 水 平 e 都 意味 着 工人 
是 低能 力 的 :对 所 有 ee MA y(tHle)0。 尽 管 这 一 推断 看 起 来 可 能 
比较 奇怪 , 可 精炼 中叶 斯 均衡 的 定义 中 并 没有 任何 条 件 将 其 排除 在 外 。 画 
为 要 求 1 到 3 并 设 有 对 不 处 于 均衡 路 径 上 的 推断 进行 任何 限制 , 而 要 求 4 
对 信号 博弈 又 没有 意义 -我 们 将 在 第 4.4 节 应 用 的 再 精炼 方法 的 确 对 信号 
博 变 中 处 于 均衡 路 径 之 外 的 推断 进行 限制 ,事实 上 , 它 排 除了 这 里 所 分 析 的 
推断 。 在 这 里 对 混同 均衡 的 分 析 中 ,我 们 重点 讨论 这 一 推断 是 为 了 叙述 上 
的 简明 , 但 同时 也 简要 考虑 其 他 推断 。 
如 果 企 业 的 推断 为 
0 24 ee, 
“uCHle)= ( Yee, 


则 据 (4.2.1) 企 业 的 战略 为 
y(L,e} x ee, 


wle)= | _ 
Wp 4e=e, . 
能 力 为 ?的 工人 有 而 将 选择 满足 下 式 的 < 
max wt e) ~— ely, e). (4.2.5) 
(4.2. 5) 的 解 二 分 简单 : 能 力 为 5 的 工人 或 者 选择 ey, 或 者 选择 使 y(L,e) 
-eye) 最 大 化 的 教育 水 平 ( 后 者 恰好 等 于 低能 力 工人 的 e"”( 工 ))。 在 图 
4.2.7 听 示 的 例子 中 ,前 者 对 两 种 类 型 的 工人 都 是 最 优 的 :低能 力 工 人 通过 
点 [e" CL), w” (上)] 的 无 差异 曲线 处 于 其 通过 点 (0, w, ) 的 无 差异 曲线 下 
方 ,而 高 能 力 工人 通过 点 (ej, w;) 的 无 差 江 曲线 处 于 工资 函数 w = yL, e) 
的 上 方 。 结 论 就 是 ,给 定 图 4.2.7 PHAR HR EP ew Pe, 的 
值 ,工人 的 战略 [e( 工 ) 一 ep e(H) = ep] 和 (4.2.3) 式 的 推断 pe (Hid UR 
《4-2.4) 式 企业 的 战略 w(e) 为 博弈 的 混同 精炼 贝 叶 斯 均衡 。 


- {4.2.3} 


(4.2.4) 


186 sie ade ay 


vtH.e} 


a vy(H, ey 
+(1-qg ye) 


y{L,e) 


BA 4.2.7 


在 图 4.2.7 aA, PER CE Ra EP, ESF 
RARE OT a. PE Ee, TA) RE BF 
育 水 平 (而 不 是 图 中 所 示 的 es); 还 有 的 均衡 中 工人 选择 的 教育 水 平 相 辣 ， 
但 均衡 路 径 之 外 情况 有 所 差异 。 作 为 前 一 情况 的 一 个 例子 , 令 e 表示 处 于 
ep 和 e" 之 间 的 教育 水 平 ,其 中 图 4.2.7 中 的 ATCA EAEL) w 
( 工 )) 的 无 差异 曲线 与 工资 函数 由 =gy(5,e)+(0I-9) 9(L, ce) BAM 
的 教育 水 平 。 如 果 我 们 在 (4.2.3) 和 (4.2.4) 式 中 用 = E en 则 得 到 的 企 
业 的 推 斯 和 战略 与 工人 的 战略 [e( 工 )= 2,eCH) = 6] 构 成 了 另外 一 个 泥 同 
精炼 贝 叶 斯 均衡 ;作为 后 一 种 情况 的 一 个 例子 , 假设 企业 的 推断 满足 
(4.2.3), 只 不 过 教育 水 平 高 于 e* 时 , 企业 推断 工人 的 类 型 根据 其 先 验 概率 


随机 分 布 : 
o Hese Re=e, 
u(tHle)=1g Ae=e, 


q 4ere’, 
其 中 图 4.2.70 e "为 高 能 力 工人 通过 点 (er mp) 的 无 差异 曲线 与 工资 函数 
w=qg'yl H, e)+(1-g) ofLe) 的 交点 所 对 应 的 教育 水 平 。 则 企业 的 战 
略为 : 
ytLye) 4 e<e’,Re=e, 
wer Wy 4e=e, 
Wy Hede 。 
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bab di Mb 5 ET A RRB A Be A RB Ce CL) = es, CH) = ep) 为 第 三 个 
混同 精炼 贝 叶 斯 均衡 。 

现在 ,我 们 转向 对 分 高 均衡 的 讨论 。 在 图 4.2.5( 无 护 妨 的 情况 ) 中 , 最 
自然 的 分 离 精 烽 下 叶 斯 均衡 中 工人 的 战略 为 [efL)=e” (LL), e CH) =e" 
{五 )], 则 信号 声 求 3 决定 了 在 观测 到 两 个 教育 水 平 中 和 任何 一 个 后 企业 的 推 
断 ( 具 体 地 讲 , wx[Hle"(L)]=0 且 jy[ 玉 le"(H)]=1), 于 是 据 (4.2.1) 可 
得 wle*(L))=w' (L)B wle*(H)]= za" (H). 与 对 混同 均衡 的 讨论 
相似 , 要 完成 对 这 一 分 离 精 煤 页 叶 斯 均衡 的 描述 还 需要 :(i)y 明 确 非 均 衡 的 
教育 水 平 ( 即 除 e”( 工 ) 和 e”( 百 ) 之 外 的 es 的 值 ) 被 选中 时 企业 的 推 斯 py [五 
le) ,根据 (4.2.1) 它 又 决定 企业 战略 mwfe) 的 其 余部 分 ;和 (fi 证 明 能 力 为 
7 的 工人 对 企业 战略 ww (e) 的 最 优 反 应 就 是 选择 e = ee* (有 7)。 

满足 这 些 条 件 的 推断 之 一 是 如 果 教 育 水 平 e BMF eC), 则 工人 是 
高 能 力 的 , 否则 便 是 低能 力 的 ， 

0 当 e<e” (DH) 
aalo = |S Yee . (4.2.6) 
TÆ, 企业 的 战略 相应 为 
y(L,e) 当 e<e'(H) 
wle}= 
y(H,e) 4 exe" (HH) 

由 于 e”( 末 ) 是 高 能 力 工 人 对 工资 男 教 w=, OPRARN, EREE 
同样 也 是 最 优 反 应 。 对 低能 力 工 大 来 讲 , 当 工 资 范 数 为 w = yl(L,e) 时 ,e* 
( 工 ) 是 该 工人 的 最 优 反 应 ,那么 wi (hL)-c(Lie* (LALA e< | 
e" {五 ) 的 选择 中 可 能 达到 的 最 高 收益 。 由 于 低能 力 工人 的 无 差异 曲线 较 
高 能 力 工人 的 更 为 陡峭 , w “(日 ) 一 c[L,e "(HH)] 为 低能 力 工人 在 所 有 ez 
e*( 琅 ) 的 选择 中 可 能 达到 的 最 高 收益 。 那 么 , 因为 在 没有 妒 嫉 的 情况 下 ， 
mW (Le[Le (LD)]>w (H}- ciL, e" (HH)],e" (人工 ) 便 是 低能 力 工 
人 的 最 忧 反应 。 

此 后 , 我 们 不 再 考 起 没有 妒 嫉 的 情况 。 前 面 已 经 查 到 ,图 4.2.6( 存 在 
妨 娘 的 情况 ) 更 为 有 趣 。 这 时 高 能力 工人 不 能 简单 地 只 舍 选 择 教育 水 平 e* 
CRY REBEL w(e) = y( 晶 ,e), 而 在 完全 信息 条 件 下 则 可 以 。 为 
了 证 明 其 能 力 , 高 能 力 工人 必须 选择 e, > e * (CH), 如 图 4.2.8 所 示 , 因为 低 
BEA LA eo "(ADB e 之 间 的 任何 教育 水 平 e, MRICS ek 
误 以 为 他 属于 高 能 力 工 人 的 话 。 正 式 地 讲 , 现在 一 般 的 分 高 精炼 贝 叶 斯 均 
衡 中 ,工人 的 战略 为 [efL)=e C(L) e(H) =e}, 均衡 推断 x[Hle*(L)] 


(4.2.7) 
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=0 H el Hle]=1IWRe Www LE w’ Le (L))=w* (LIA wle,) 
=3(88e:)。 这 也 是 我 们 通过 第 .4.4 节 的 再 精炼 之 后 惟一 留存 的 均衡 结 
果 。 


di 
HH.e) 


yiL, e) 


e*(L) e*(H) es 


4.2.8 


如 下 企业 对 均衡 以 外 的 教育 水 平 的 推断 可 以 支持 上 面 的 均衡 结果 :如 

‘Bete, 工人 是 高 能 力 的 ;否则 就 是 低能 力 的 : 
0 当 e<e, 
o= 人 4 ee, . 

于 是 , 企业 的 战略 为 
ytLe) 当 e<e, 
y(H, e) H ee. , 
给 定 上 面 的 工资 函数 , 低能 力 工人 有 两 个 最 优 反 应 :选择 e" (上) 并 挣 得 
w (LRA e 并 赚 得 yH, e), 我 们 将 假定 出 现 这 一 无 差异 的 情况 
时 , 工人 更 倾向 于 e*( 工 ); 或 者 我 们 也 可 以 将 e。 提高 一 个 非常 小 的 量 , 使 得 
低能 力 工人 严格 倾向 于 选择 e"( 工 )。 对 商 能 力 工 人 来 讲 , 由 于 e >e’ 
(H), 选择 e>e, 要 较 e 为 劣 。 由 于 低能 力 工人 的 无 差异 曲线 较 高 能 力 工 
人 的 更 为 陡峭 ,后 者 通过 点 (e,, » CH, e DATAR RY e< e, 时 处 于 工 
资 函数 w= y(EL,e) 的 上 方 ,所 以 选择 e< e, AR Re, HH. MM, 高 能 力 
工人 对 企业 战略 wwfe) 的 最 优 反应 为 e,。 

和 混同 均衡 的 情况 一 样 ,博弈 也 存在 另外 的 分 离 均衡 , 在 一 些 均衡 中 ， 
高 能 力 工人 选择 不 同 的 教育 水 平 (低能 力 工 人 总 是 因 选 择 e"(L ) 而 被 分 
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离 , 参 见 下 文 ), 还 有 些 均衡 中 教育 水 平 的 选择 e* (L).e, 与 这 里 的 相间 , 但 
处 于 均衡 路 径 之 外 的 推 其 不同。 作为 前 者 的 一 个 例子 , 令 为 高 于 e, 的 教 
育 水 平 ,但 又 不 足以 高 到 使 高 能 力 工 人 不 原意 选择 e, 而 宁愿 被 认为 自己 是 
低能 力 的 :对 所 有 e,y( 玉 ,6 一 c( 玉 ,8)) 痢 要 太 于 y(L,e)-c(H,e)a W 
举 我 们 在 图 4.2.8 的 博弈 中 ,用 e BR, (Hle) 和 wte) 表 达 式 里 的 e, W 
由 此 形成 的 企业 的 推断 和 战略 与 工大 的 战略 [e( 工 )=e" (LIL),e(H)=8] 一 
起 ,构成 一 个 分 离 的 精炼 风 叶 斯 均衡 。 作 为 后 者 的 一 个 例子 , 令 企 业 对 严格 
处 于 e" (HW) Me, 之 间 的 教育 水 平 的 推断 严格 大 于 0, 为 一 个 足够 小 的 正 
数 , 使 得 据 此 得 出 的 战略 w(e) 严 格 处 于 低能 力 工人 通过 点 (eC 上),w* 
( 工 )) 的 元 差异 曲线 的 直方 。 

本 节 的 最 后 ,我 们 简 变 讨 论 一 下 麻 合 均衡 。 其 中 一 种 类 型 肯定 选择 某 
一 教育 水 平 ,但 另 一 种 类 型 随机 选择 是 与 第 一 种 类 型 混同 (通过 选择 前 一 区 
型 的 教育 水 平 ), 还 是 与 前 一 类 型 分 离 (通过 选择 不 同 的 教育 水 平 )。 我 们 分 
析 低 能 力 工人 随机 选择 的 情况 : 习题 4.7 讨论 互补 的 情况 。 假 设 高 能 力 工 
人 选择 教育 水 平 aa( 这 里 脚 标 A SR RG Chybrid)), 但 低能 力 工 人 人 随机 选 
FE es( 碎 x 的 概率 ) 或 eL( 以 1 一 x 的 概率 )。 信 号 要 求 3( 将 其 扩展 到 人 允许 混 
合 均衡 存在 的 情况 仍 适 用 ) 决 定 了 企业 在 观测 到 e 或 er 后 的 推断 ; 据 贝 叶 
斯 法 则 可 得 了 了 


—— FF 
uCHle d= Ta gn (4.2.8) 


并 且 根 据 常 识 可 得 观测 到 er 后 的 推断 mw( 万 |er)y=0。 以 二 三方 面 有 助 于 
理解 (4.2.8) :第 一 ,由 于 高 能 力 工 人 准 是 选择 a, 但 低能 力 工 人 只 以 的 
概率 选择 e 观测 到 mx ,就 说 明 工 人 为 高 能 力 的 概率 要 重 高 一 些 , 于 是 mx 
(Hie) >g BL, 4x 趋向 于 0 时 , 低能 力 工 人 几乎 不 会 和 高 能 力 工 人 混 
间 , 于 是 y(Hie) 趋 于 1; 第 三 , 当 “w 趋 于 1 时 ,低能 力 工 人 人 刀 乎 总 是 和 高 能 
力 工人 混同 ,于 是 Hle BFA qo 

当 低 能 力 工 人 选择 er ,从 而 可 与 高 能 力 工 人 相 分 高 于 ,推断 Hle) 
=0 BERS LR wle)=y(Lie,), PM MO FEW e MAB ee" (LL). HE 
(EIR ABS A RFE ER KOE OPE BL, 
还 是 前 面 讨 论 分 离 均 衡 时 的 确定 情况 中 ) 为 工人 在 完全 信息 下 所 选择 的 教 


由 ”回顾 第 116 页 第 3 章 脚 注 的 内 容 ; 风 叶 斯 法 则 为 P(AL1B) = pA, B) pB) SFU 
(4.2.8), 可 将 贝 叶 斯 法 出 写 为 ptA,B8)= ABLA) pC A), FB p( Al B= p(BIA}-ptA)/p 
(B). 
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BRE e*(L). AMX BR, 要 设 低 能 力 工人 通过 选择 另外 的 e 
e (人 工 ) 案 现 了 分 离 , 这 种 分 离 可 带 来 收益 yL, eL) -ell eL), 但 选择 e” 
《二 ?可 得 到 的 最 小 收益 为 yLL,e ”(L)] 一 c[L:e” (EL)] (如 果 企 业 的 推断 
el Ale (让 大 于 如 时 还 可 能 更 高 ),. 而且 对 e"( 工 ) 的 定义 意味 着 对 所 有 
ÈJ ee" CL), SA y(Lire"(L)]-clL,e* (LJ) >¥ (Lie) -c€ Lie), M 
而 ,不 存在 教育 选择 ec, Fe” 《 工 ), 且 使 低能 力 工 人 有 动机 选择 cl, 从 而 实 现 
分 高。 

为 使 低能 力 工 人 愿意 随机 选择 分 离 结果 e" (上 ) 或 混同 结果 ea, 工资 水 
E wle) = w, 必须 使 得 工人 在 两 者 问 的 选择 是 无 差异 的 : 


w"C(L)-—c(Lie"(£L)J=un,—e(Lien). (4.2.9) 
然而 , 为 使 w, 成 为 企业 支付 的 均衡 工资 , 据 {4.2.1) 和 (4.2.8) 可 得 
= + a- Yr + Ë 
EG ade Aad G a) y(Lyen) . (4.2.10) 


对 一 个 给 定 的 en B, 如 果 (4.2.9) 的 结果 w, < yCH, es), 则 (4.2.10) 可 以 
确定 满足 杂 合 均 奖 条 件 的 惟一 E, 这 时 低能 力 工人 人 随机 选择 。e"(L) 或 
eh; 而 如 果 uw, > yl H, en); 则 对 这 样 的 ei 值 ,不 存在 杂 合 均 街 。 

图 4.2.9 间接 表示 出 特定 的 es 值 , 及 与 之 相应 的 r 值 。 给 定 e, 工资 


w 
WH.,e) 
Y ytH 2} 
+l- r) Lr) 
wW, 


qy(H,e) . 
+0 -q)yiLe) 


yiL e) 


w*{L) 


Æ 4.2.9 
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w, 为 (4.2.9) 的 解 ,于 是 点 (6, ws) 处 于 慨 能 力 工 人 通过 点 [e* (LL),w* 
( 工 )] 的 无 差异 曲线 上 。 给 定 wi <yCH, er) 概率 + 满足 r-y(H,e,)+(1 
-ri yl L, en) = 这 一 概率 即 为 企业 的 均衡 推断 oe Cle), FE 
(4.2.9) n= qQ1-r)/rl-q). WHA, 约束 条 件 w < ¥ CH, e,) 
等 同 于 er <en 其 中 e, 为 图 4.2.8 的 分 离 均衡 中 高 能 力 工 人 选择 的 教育 水 
平 。 事 实 上 , 随 ec, Ber BF 1, FH eB 0. All, 4.2.8 描述 的 
分 离 均 衡 为 这 里 考虑 的 杂 合 均衡 的 极限 情况 。 

为 完成 对 图 4.2.9 中 打 合 精炼 贝 叶 斯 均衡 的 描述 , 令 企业 的 推断 为 :如 
Ae e 和 ay, 工人 是 低能 力 的 ,次 则 是 高 能 态 的 概率 为 >, 低能 力 的 概率 为 1- >: 


0 Hele 
saos Hee. 
于 是 , 企业 的 战略 为 
y(L,e} H e<e, 
weer | Het ryLe) Bebe. 


现在 , 只 余下 检验 工大 的 战略 (e (IL) 以 x 的 概率 为 e, ,以 1 一 x 的 概率 为 e* 
(LL);e( 昌 )= es) 蚌 企业 战略 的 最 优 反 应 。 对 低能 力 工人 来 讲 , BR e< 
e, He" (L) AA MR exe 为 ae,。 对 高 能 力 工 人 来 讲 ,e， BRE 
其 他 选择 。 


4. 2.C 公司 投资 和 资本 结构 


考虑 一 个 企业 家 已 经 注册 了 一 个 公司 ,但 需要 对 外 融资 以 投入 一 个 颇 
显 吸引 力 的 项 目 。 企 业 家 有 关于 已 经 存在 公司 盈利 能 力 的 私人 信息 , 但 是 
新 项 目的 收益 却 无 法 从 原 企业 收益 中 分 出 一 一 所 能 观测 到 的 , 只 有 企业 总 
的 利润 水 平 。( 我 们 也 可 以 允许 企业 家 对 新 项 目的 恰 利 能 力 掌握 私人 信息 ， 
但 这 却 会 带 来 不 必要 的 复杂 }。 假 设 企业 向 次 在 投资 者 承诺 一 定 的 股权 份 
额 ,以 换取 必要 的 资金 。 那 么 , 在 什么 条 件 下 应 该 上 马 新 项 目 , 并 且 承 诺 的 
股权 份额 应 该 为 多 少 ? 

为 把 上 述 问 丁 转 化 为 一 个 信号 博弈 ,假设 现存 公司 的 利润 要 么 高 , 要么 
低 :r= 工 或 互 ,这 里 亡 > 工 >0。 为 表现 出 新 项 目 是 具有 吸引 力 的 ,假设 需 
要 的 投资 为 1 将 得 到 的 收益 为 民 ,潜在 投资 者 其 他 方式 投资 的 回报 为 r, 
AR>i(1L+ r+)。 则 博弈 的 时 间 呀 序 和 收益 情况 如 下 ; 

1. 自然 类 定 现 存 公司 的 利润 状况 ,x= 工 的 概率 为 p; 

2. 企业 家 了 解 到 x, 其 后 向 潜在 投资 者 承诺 一 定 的 股权 益 份额 ;, 这 里 


162 AER re Ea 


Os 1; 
3. 投资 者 观测 到 ; {但 不 能 观测 到 x), 然后 决定 是 接受 还 是 拒绝 这 一 
要 约 ; l 
4. 如 果 投 资 者 抠 绝 要 约 , 则 投资 者 的 收益 为 + r), 企业 家 的 收益 
An, 如 果 投 资 者 接受 , 则 投资 者 的 收益 为 s(x+ R), 企业 家 的 收益 
为 (1 一 sj) (rx+ RR)。 
近 尔 斯 和 近 卢 夫 (1984) 分 析 的 模型 即 属 此 类 , 尽管 他 们 考虑 的 是 一 大 
会 司 ( 有 股东 和 有 经理) 而 非 私 人 企业 { 惟 一 的 所 有 者 充任 会 可 经 理 )。 怨 们 讨 
论 了 有 关 股 东 利 益 如 何 影响 经 理 效用 的 不 同 很 定 ; 迪 布 维 格 和 森 德 (Zen- 
der)f1991) 推 导出 股东 和 经 理 人 员 间 的 最 优 合约 安排 。 
这 是 一 个 非常 简单 的 信号 博 旗 ,从 以 于 两 个 方面 可 以 看 出 :接收 者 行动 
的 可 行 集 非常 有 限 , 发 类 者 的 可 选 信 号 稍微 多 一 些 , 但 很 多 是 无 效率 的 { 随 
后 我 们 将 会 看 到 )。 假 设 在 接收 到 要 约 ; 之 后 ,投资 者 推断 "= 上 的 概率 为 
qo 则 投资 者 将 接受 ;, SHARH 
s[aL+(1—-y)H+R])EI(l+tr). (4.2.11) 
对 企业 家 来 讲 , 假设 现存 公司 的 利润 为 n 并 考虑 是 愿意 以 股权 份额 s 为 代 
价 获 得 融资 ,还 是 放弃 这 一 项 目 。 当 且 仅 当 干 式 成 立时 , 前 者 更 为 可 跟 


:< - (4.2.12) 


在 混同 精炼 贝 呈 斯 均衡 中 , 投资 者 在 接收 到 均衡 要 约 之 后 的 推断 必须 
为 gq =p。 由 于 立项 约束 (4.2.12) 在 x= 五 时 比 x=4 时 更 难以 满足 ,将 
(4.2.11) 和 (4.2,12) 联 合 起 来 意味 着 混同 均衡 只 有 下 式 成 立时 才 存 在 : 


TI{l1+r R 
PL+ (1b) H+RH+R R'’ (4.2.13) 


如 果 pp 是 够 接近 于 0, (4.2.10, AA R> +r) PWR p E 
ae eet 1, (4.2.13) Rw, 只 有 


R-10+r)> Gee, (4.2.14) 


从 直观 理解 ,混同 均衡 的 困难 之 处 在 于 , 高 利润 类 型 必须 补贴 低 利 润 类 型 : 
在 (4.2.11) 中 令 g= 户 , 可 得 > 六 1i+tri[iL+tL 一 区 ) 瑟 +R1 而 如 果 投 
资 者 确信 r= HCE eg=0), 则 他 将 接受 更 小 的 权益 份额 sr + ry/AH+ 
R) 。 混 同 均衡 中 所 要 求 的 更 大 的 权益 份额 对 高 利 省 企业 来 讲 是 非常 昂贵 
的 也 许 昂贵 到 使 高 利润 企业 更 愿意 放弃 这 一 新 项 目 。 我 们 的 分 析 证 
明 , 只 有 p 足够 接近 于 0 时 才 存 在 混同 均衡 ,这 时 可 三 少 补贴 成 本 ;或 者 如 
困 (4.2.14) 成 立 ,这 时 新 项 目 产 生 的 利润 足以 超出 补贴 成 本 。 
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如 果 (4.2.13) 不 成 立 , 则 不 存在 混同 均衡 , RMI BRAES BW. 1K 
利润 类 型 的 要 约 为 := IT(1+r)/(L+ 民 ), 投 资 者 接受 ;高 利 泪 类 型 的 要 约 
为 5<IC+r)AH+ 民 ) ,被 投资 痢 拒绝 。 在 这 样 的 均衡 中 ,投资 水 平 无 效 
率 地 降低 了 :新 项 目 肯定 是 可 以 带 来 利润 的 ,但 高 和 询 类 型 的 企业 却 放弃 了 
投资 。 这 一 均衡 也 说 明了 发 送 者 的 可 行 信号 集 无 效率 的 情况 :高 利润 类 型 
的 企业 没有 办 法 把 自己 区 分 出 来 一 一 对 高 利润 类 型 有 吸引 力 的 融资 条 件 对 
低 利润 类 型 甚至 更 具有 吸引 力 。 正 如 和 迈 尔 斯 和 迈 卢 夫 所 观察 的 结果 , 模型 
表现 出 的 内 在 机 制 人 迫使 企业 寻求 债务 融资 或 寻找 内 部 资金 渠道 。 

最 后 , 我 们 简单 考虑 企业 家 在 选择 股权 融资 的 同时 ,还 可 以 选择 全 务 融 
资 的 情况 。 假 设 投资 者 接受 了 债务 合同 如 ,如 果 企 业 家 没有 宣布 破产 则 投 
资 者 的 收益 为 D, 企业 家 的 收益 为 x+ 玉 - 了 ;如 果 企 业 家 了 破产 , 投资 者 的 
收益 为 x+ 尺 , 企 业 家 的 收益 为 0。 由 于 工 >0, 则 总 是 存在 混同 均衡 一 一 两 
PP MRA RS SAMA D=1+7) ,并且 为 投资 者 接受 。 不 过 , me 
工 JEER, WE R+ LIO + r), WERNA AATRE E 
务 , 于 是 投资 者 也 不 会 接受 此 项 合同 。 如 果 上 和 百代 表 期 望 利润 { 而 非 确 
定 的 利润 ?时 ,也 可 以 得 到 相似 的 结论 。 人 假设 类 型 x 的 含义 为 现存 企业 的 利 
WA 172 OR A n+ Ki 1/2 的 概率 为 x 一 KK, 这 时 如 果 工 -K+R<I(l 
+r), WAR PABA A 172 的 概率 不 能 清偿 债务 D= 1014+ r), 于 是 投资 
者 不 会 接受 合约 。 


4.2.D 货币 政策 


本 节 我 们 继续 讨论 策 2.3.E 节 分 析 的 两 阶段 重复 货币 政策 博弈 ,只 是 
加 入 了 私人 信息 。 和 斯 彭 斯 的 模型 相似 , 博 三 存在 许多 混同 、 杂 合 以 及 分 离 
精炼 内 叶 斯 均衡 。 巾 于 第 4.2.B 节 我 们 已 详细 讨论 过 这 些 均衡 , 这 里 只 简 
要 勾勒 一 个 框架 。 参 见 维 克 斯 (1986) 对 相似 移 两 阶段 分 析 的 详细 讨论 ,以 
及 巴 罗 (1986) 的 多 阶段 声誉 模型 。 

第 2. 3.E 中 讲 到 的 货币 当局 的 单 阶段 收益 为 

W(x, 0°) = — cn? —- [Cb - Ly? tad(x— rn)]’, 

EF r 为 真实 的 通货 膨胀 , n* 为 雇主 们 的 期 望 通货 膨胀 , y' 为 有 效率 芍 产 
出 水 平 。 对 雇主 们 来 讲 , 单 阶段 的 收益 为 一 (x, x 六。 在 我 们 的 两 阶段 模型 
中 ,每 一 参与 者 的 收益 都 是 各 参与 者 单 阶段 收益 的 简单 相 加 , Wy, xi) + 
Wena + nD) 和 一 (m,n) 一 《xs 一 eh BB, WR: 的 真实 通货 膨胀 ， 
x 为 雇主 们 (在 上 阶段 开始 时 ) 对 阶段 + 通 沉 膨胀 的 预期 。 

收益 函数 Win, x ) 中 的 参数 c 反映 了 货币 当局 在 替 通 胀 和 有 效率 产 
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HATE mAAR, 在 第 2.3.E 节 中 这 一 参数 为 共同 知识 , 现在 我 们 
假定 这 一 参数 只 是 货币 当局 的 私人 信息 c= $= 或 WW( 分 别 表示 对 治理 遂 
货 膨胀 的 态度 强硬 (strong) 或 软 花 (weak)), 这 里 S>w>0, AMAR 
FEET Te Ra F : 

1. 自然 赋 于 货币 当局 某 一 类 型 c,c = W 的 概率 为 p。 

2. 雇主 们 形成 他 们 对 第 一 期 通货 膨胀 的 预期 xf。 

3. 货币 当局 观测 到 nj, 其 后 选择 第 一 期 的 真实 通货 膨胀 xie 

4. 雇主 们 观测 到 x( 而 不 能 观测 到 c), 然后 形成 他 们 对 第 二 期 通货 膨 

胀 的 预期 x5. 

5. 货币 当局 观测 到 af, 然后 选择 第 二 期 的 真实 通货 膨胀 。 

正如 第 4.2.A 节 已 经 注 明 的 ,从 这 一 两 阶段 货币 政策 搏弈 当中 可 以 抽 
象 出 单 阶段 信号 博弈 。 发 送 者 的 信号 为 货币 当局 对 第 一 期 通货 膨胀 水 平 的 
选择 xi, 接收 者 的 行动 为 雇主 们 对 第 二 期 通货 膨胀 的 预期 zo ET 
期 通货 膨胀 的 预期 以 及 货币 当局 第 二 期 对 真实 通货 膨胀 水 平 的 选择 分 别 为 
信和 号 博弈 之 前 及 之 后 的 行动 。 

回顾 在 单 阶段 问题 ( 即 第 2.3.E 节 分 析 的 重复 博弈 中 的 阶段 博弈 } 中 ， 
给 定 雇主 们 的 预期 r, 货币 当局 对 x 的 最 优选 择 为 


ne d * 2 
T (nf) = tl 6)y +dr‘]. 


FER TESS ib EK BR ih SS c, EA i, 则 其 对 x 
的 最 优选 择 为 


lO)y + dn Ci) - 
预测 到 这 一 点 ,如 果 雇 主 们 推断 c= W 的 概率 为 eg, 并 据 此 开始 第 二 阶段 的 
博弈 , 则 他 们 将 选择 rig), 以 使 下 式 最 大 化 
~ glin? (n, W) — ni] - C1 - g) [ey (xi, SD - ng]. (4.2.15) 
在 混同 均衡 中 , 两 种 类 型 所 选择 的 第 一 期 通货 脱 胀 相同 , 不 妨 以 oe E 
示 , 于 是 , 雇主 们 第 一 期 的 预期 为 x1 = x"。 在 均衡 路 径 上 ,雇主 们 推断 c= 
W 的 概率 为 ,开始 第 二 阶段 的 博弈 , 并 形成 预期 x5(p), 则 类 型 为 c 的 化 
币 当局 对 给 定 的 预期 , 选择 最 优 的 第 二 期 通货 膨胀 水 平 。 具 体 而 言 即 为 #5 
Txtp),c], 如 此 博弈 结束 。 为 完成 对 这 样 一 个 均衡 的 描述 , 还 必须 ( 同 往 
常 一样) 明确 接收 者 处 干 均衡 路 径 之 外 的 推断 ,根据 (4.2.15)? 计 算 相 应 的 均 
衡 路 径 之 外 的 行为 , 并 检验 这 些 均衡 路 径 之 外 的 行为 对 任何 类 型 的 发 送 者 ， 
都 不 会 使 他 有 动机 偏离 均衡 。 
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在 分 离 均 衡 中 , AN TS ae FF Ys OS —— BS AOR ed, 分别 以 rw 
和 x, 表示 ,于 是 雇主 们 第 一 阶段 的 预期 为 = prw t+ (1 一 g)xs。 观 测 到 
nw 之 后 , 雇主 们 推断 c= W 并 开始 第 二 阶段 ,形成 预期 x (1) ;类似 地 , 观 
测 到 rs 形成 的 预期 为 天 (0)。 在 均衡 中 , 软弱 类 型 选择 xf lei), W], 强 
硬 类 型 则 选择 az [x(0), S], 博 弈 结束 。 为 完成 对 这 一 均衡 的 描述 , 不 仅 
要 明确 接收 者 均衡 路 径 之 外 的 推 斯 和 行动 , 并 检验 没有 任何 类 型 的 发 送 者 
将 有 动机 偏离 ,这 和 和 前面 相同; 而 且 还 变 粒 验 两 种 类 型 都 没有 动机 去 伪装 另 
外 类 型 的 行为 。 在 这 一 博 宅 中 , 软弱 类 型 可 能 会 在 第 一 阶段 被 吸引 选择 
rs, 基 而 诱 使 雇主 们 第 二 阶段 的 预期 为 n0), 并 在 其 后 选择 xf [25(0), 
琵 ] 使 博弈 结束 。 这 是 由 于 即使 rs 较 低 , 以 至 于 软弱 类 型 有 些 不 情愿 , 但 
都 会 使 0h (0) SE Ht AR, 使 之 可 从 第 二 阶段 的 预料 外 通货 膨胀 r [28 (0), 
琴 ]- 亚 (0) 之 中 获得 巨大 收益 。 在 分 离 均衡 中 , 强硬 类 型 选择 的 第 一 期 通 
HERKEL EBRE, 使 得 软弱 类 型 没有 动力 去 伪装 成 强硬 类 型 ,即使 在 
第 二 阶段 可 获得 预料 外 通货 膨胀 的 好 处 。 对 许多 参数 的 值 , 这 一 约束 使 得 
rs 低 于 强硬 类 型 在 完全 信息 下 将 会 选择 的 通货 膨胀 水 平 , Ee r 
型 的 分 离 均衡 中 ,高 能 力 工 人 将 过 度 投资 于 教育 一 样 。 


4.3 ”精炼 贝 叶 斯 均衡 的 其 他 应 用 


4.3.A SiRF 


空谈 博弈 类 似 于 信号 博弈 ,但 在 空谈 博弈 中 , 发 送 者 的 信号 只 是 口头 表 
态 一 一 - 既 不 需要 成 本 , 亦 没有 约 东 作用 , 也 无 法 查证 构成 任何 义务 。 这 种 口 
头 表态 在 斯 茧 斯 的 信 叶 博弈 中 是 无 法 得 到 有 用 结果 的 :一 个 工人 简单 宣称 
“RS AAR BAO. PERM), 空谈 也 可 能 会 有 效果 。 
作为 一 个 简单 的 例子 ,考虑 很 可 能 发 生 的 一 种 情况 “路 上 小 心 那 辆 公共 汽 
车 !1"。 在 经 济 学 的 应 用 中 ,斯坦 (Stein, 1989) 证 明 联储 对 政策 的 表态 能 起 
到 一 定 作 用 ,但 又 不 能 太 精 确 计 算 。 马 修 斯 (Matthew, 1989) 研 究 了 总 统 佳 
用 否决 权 的 威胁 如 何 影 响 到 议会 对 法 案 的 表决 。 内 分 析 特 定 环境 中 空谈 博 
弃 的 效果 之 外 ,我 们 也 许 更 关心 如 何 设计 一 个 环境 ,可 以 利用 空谈 博弈 的 优 
点 。 为 此 , 奥斯汀 -史密斯 (Austen-Smith, 1990) 证 明 在 某 些 机 制 下 , 自 利 的 
立法 者 之 间 相 互 争 论 , 可 以 提高 最 终 法 案 的 社会 价值 , 法 雷 尔 和 吉本 斯 
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(1991) 证 明 在 特定 机 制 下 , 工会 可 以 提高 社会 福利 (尽管 会 带 来 第 2.1.C 
节 瓜 述 的 就 业 扭曲}, 因为 它 可 以 促进 工大 和 管理 层 之 闻 的 相互 沟通 。 

空谈 在 斯 责 斯 的 模型 中 起 不 到 任何 作用 , 是 因为 所 有 类 型 的 发 送 者 对 
接收 者 可 能 的 行为 有 着 相同 的 偏好 :所 有 工人 都 希望 较 商 的 工资 ,而 不 论 其 
实际 能 力 如 何 。 为 了 理解 为 什么 发 送 者 偏好 的 一 致 性 会 影响 空谈 的 作用 
《无 论 是 在 斯 彭 斯 模型 还 是 在 更 为 一 般 的 情况 下 ), 假设 存在 一 个 纯 战 略 均 
衡 , 其 中 部 分 类 型 的 发 送 者 Ti 选择 一 种 信号 m, 而 另外 类 型 的 发 送 者 Ta 
选择 另外 一 种 入 号 ml BT T 可 以 只 包 舍 一 个 类 型 ,如 在 分 离 均衡 中 的 
情况 ;也 可 以 包含 多 种 类 型 ,如 在 部 分 混同 均衡 中 )。 在 均衡 时 , 接收 者 将 认 
E m BAT, 发 出 的 , 并 在 此 推断 下 选择 最 优 行动 ;我 们 用 a 表示 这 一 行 
动 。 由 于 所 有 类 型 的 发 送 者 对 行动 都 有 相同 的 偏好 , 如 果 基 一 类 型 B( 比 方 
说 ) 在 a, 和 as 之 间 更 偏好 za 既然 所 有 类 型 的 偏好 都 一 样 ,那么 都 会 选择 
发 送信 号 mi, 而 不 会 发 送 ma 从 而 破坏 了 前 面 假设 的 均衡 。 例 如 在 斯 彭 
斯 模型 中 , 如 果 一 种 空谈 信号 的 结果 是 高 工资 ,而 另 一 种 空谈 信号 的 结果 是 
ELE, 则 所 有 能 力 水 平 的 工人 都 会 选择 前 一 种 信号 ,于 是 就 不 可 能 存在 一 
个 空谈 可 以 影响 均衡 的 工资 。 

这 样 , 要 使 空谈 起 到 作用 .一 个 必要 条 件 是 不 同类 型 的 发 送 者 对 接收 者 
行为 的 偏好 不 同 。 第 二 个 必要 条 件 当然 就 是 接收 者 基于 发 送 者 的 不 同类 
型 ,选择 的 最 优 行为 不 同 ( 恕 果 接 收 者 的 最 贷 行 为 与 发 送 者 的 类 型 元 关 , 信 
号 和 空谈 都 豪 无 作用 )。 空 谈 发 挥 作用 的 第 三 个 必要 条 件 是 接收 者 所 偏好 
的 行动 不 会 完全 遭 到 发 送 者 的 反对 。 为 理解 这 一 条 忻 ,假设 当 发 送 者 的 类 
型 为 爸 时 ,接收 者 偏好 的 行动 为 低 ;发 送 者 类 型 为 高 时 ,接收 者 偏好 的 行动 
为 高 。 如 果 低 类 型 的 发 送 者 偏好 的 行动 是 低 , 高 类 型 发 送 者 偏好 的 行动 是 
高 , 则 交流 得 以 进行 ;但 如 果 发 送 者 的 偏好 反 过 来 , 则 交流 就 不 能 达成 , 因为 
发 送 者 将 会 误导 接收 者 。 克 劳 福 德 和 索 贝尔 (1982) 分 析 了 一 个 满足 上 述 二 
个 必要 条 件 的 抽象 模型 , 并 建立 了 两 个 直观 缚 果 ,一 般 而 言 , 当 参 与 者 之 间 
的 偏好 排列 更 为 接近 时 ,通过 空谈 可 能 达成 的 交流 就 更 多 ,但 除非 参与 者 偏 
好 的 排列 是 完全 一 致 的 , 无 法 达到 完美 的 交流 。 

前 面 提 到 的 每 一 经 济 学 应 用 -一 -美联储 的 空谈 否决 权 的 或 胁 、 辩 论 中 
的 信息 交流 ,以 及 工会 作用 一 一 都 不 只 涉及 到 简单 的 空 读 博弈 ,还 要 用 到 相 
应 经 济 学 领域 更 为 复杂 的 模型 。 要 分 析 这 些 应 用 的 任何 一 种 , 都 不 仅 要 描 
述 单纯 的 博弈 ,还 需要 用 复杂 的 模型 相配 合 ,而 这 样 又 会 转移 我 们 的 注意 
力 ,忽略 空谈 博弈 本 身 的 机 制 。 所 以 , 本 节 我 们 暂时 采用 与 书 中 其 余部 分 不 
一 致 的 风格 , 只 分 析 抽 象 的 空谈 博弈 , 而 把 未 四 作为 进一步 阅读 的 内 容 。 
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Fe fe) Fe RE EB BT Le] SR 9 SE BS A, 只 是 
收益 情况 不 一 致 。 
1. BAB TS T= fey. ti! 中 根据 概率 分 布 pr TE 
送 者 某 一 类 型 a, 其 中 对 所 有 i, plz)>0, 且 pli)+:…+p(z1)= 
1; 
2. 发 送 者 观测 到 :,, 然后 从 可 行 的 信号 集 M | my, ,mi 中 选择 一 个 
六 和 号 mjs 
3. 接收 者 观测 到 zj 而 不 能 观测 到 1,), 然后 从 可 行 的 行动 集 4 = 
faqs, as1 中 选择 一 个 行动 aps 
4. 驱 方 的 收益 分 别 由 Ustz, aT Url a, Aw. 
此 类 空谈 博弈 的 关键 特征 是 , 信号 不 论 对 发 送 者 还 是 接收 者 的 收益 苹 
数 ,都 没有 直接 影响 。 信 号 能 发 挥 作用 的 惟一 途径 是 通过 它 所 包含 的 信息 、 
借助 于 改变 接收 者 对 发 送 者 所 属 类 型 的 推断 ,信号 可 以 改变 接收 者 的 行动 ， 
从 而 对 两 个 参与 者 的 收益 发 生 间 接 影响 。 由 于 可 和 使 用 不 同 的 语言 交流 同样 
的 信息 , 不 同 的 信号 空间 能 冲 达 到 同样 的 结果 。 空 谈 的 原则 是 什么 话 都 可 
以 说 ,但 这 反映 在 模型 中 就 要 求 M PER EAN RA. Alb, RNB 
E M 中 的 元 素 !( 刚 好 ) 够 用 来 说 出 需要 表达 的 信息 ;也 就 是 说 , M = T., X} 
本 节 的 内 雁 , 这 一 假定 与 允许 什么 都 可 以 说 是 等 价 的 ;但 到 第 4.4 节 的 内 容 
CO Be UL BS A), 就 需 豆 重新 考虑 这 一 假定 了 。 
因为 最 简单 的 空谈 博弈 和 信和 号 博弈 的 时 间 上 顺序 相同 , 对 这 两 类 博弈 中 
精炼 贝 叶 斯 均衡 的 定义 也 是 相同 的 ;空谈 博弈 中 的 纯 战 略 精炼 贝 叶 斯 均衡 
为 满足 依 叶 要 求 (1).(2R)、 23S) 和 (3) 的 一 组 战略 m fa) 和 a" (mj) 及 
推断 ne (tlm). RA SBR(2R)A(2S) POM RBM Us (ti, mi, ar) 
和 Urli, my, a4) 分 别 等 价 于 这 里 的 Us t;, 0a.) Ur(i;,a4), 但 信号 博弈 
和 空谈 博弈 的 一 个 不 同 之 处 在 于 , 后 者 总 存在 一 个 混同 均衡 。 因 为 信号 对 
发 送 者 的 收益 没有 任何 直接 影响 , 如 果 接 收 者 将 忽视 任何 信 导 , 则 混同 就 是 
发 送 者 的 最 忧 反应 ;因为 信号 对 接收 者 的 收益 没有 任何 直接 影 啊 , 如 果 发 送 
者 选择 混同 ,接收 者 的 最 优选 择 就 是 忽视 任何 信和 导 。 正式 地 ， 令 a" RRR 
OBC FE FE FT RR TT ON, Th, a "满足 


max Ds Pt) URC ti ar) ， 
aca LET, 
发 送 者 选择 任何 混同 战略 , 接收 者 对 所 有 信号 都 维持 先 验 概率 推断 pl). 


(不论 是 处 于 均衡 路 径 之 上 还 是 之 外 ), 并 对 所 有 信号 都 选择 行动 a" 是 一 
个 混同 精炼 贝 叶 斯 均衡 。 从 而 空谈 博弈 中 一 个 有 意思 的 问题 就 是 是 否 存 在 
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FEV TRI 2 5. PF TT iE BY Ba HR SE PE SP Se BS BS 
同 均衡 存在 的 情况 。 

我 们 首先 考 虚 两 种 类 型 .丙种 行动 的 例子 : TT|tL, tyl prob(1L) 二 ,入 
= far aglo 我 们 也 可 以 使 用 类 似 于 图 4.2.1 中 两 类 型 ,两 信和 号、 两 行动 的 
信和 号 博弈 描述 这 里 空谈 博弈 的 收益 , 但 类 型 -一 -行动 组 合 (Ea, a, AK 
盖 与 选择 什么 信和 号 无 关 , 于 是 我 们 又 可 专用 图 4.3.1 描述 收益 情况 。 每 一 
单元 内 的 前 一 数值 表示 发 送 者 的 收益 ,后 一 数值 表示 接收 者 的 收益 ,但 此 图 
并 不 是 一 个 标准 式 博 弈 ,而 只 是 简单 表示 出 在 每 一 种 类 型 一 一 行动 组 合 时 
双方 参与 者 的 上 收益。 为 满足 前 面 所 讨论 空谈 发 挥 作用 的 必要 条 件 , 我 们 对 
接收 者 的 收益 必 了 选择 ,使 得 当 发 送 者 类 型 为 低 {#1 ) 时 ,接收 者 惕 好 的 行动 
Aika) ;类 型 为 高 时 ,偏好 的 行动 亦 为 高 。 为 体现 第 一 个 必要 条 件 , 假设 
两 种 类 型 的 发 送 者 对 行动 的 偏好 相同 ,例如 工 >>x 且 y> zw, 于 是 两 种 类 型 
在 ar May, 中 都 偏好 ar。 则 两 种 类 型 都 希望 能 使 接收 者 相信 : = ti, 于 是 
接收 者 无 法 相信 任何 一 方 的 话 。 在 这 一 西 类 型 两 行动 博弈 中 , 满足 第 一 和 
第 三 个 必要 条 件 的 惟一 情况 只 有 12r 且 y 委 双 一 参与 者 的 利益 完全 一 
致 ,可 以 理解 为 在 给 定 发 送 者 类 型 的 情况 下 , 双方 参与 者 认为 应 该 选择 的 行 
动 是 完全 相同 的 。 正 式 地 , 在 此 空谈 博弈 的 分 高 精炼 贝 叶 斯 均衡 中 ,发送 者 . 
EMRE A Loe Cty) = žie m Cte) = ty] ,接收 者 的 推断 为 ytl tL) =1H ater | 
zw) 二 0, 并 且 接 收 者 的 战略 为 [a (tp) =a, alty)= aglo AERA A 
FED AR SY ara, 每 一 类 型 的 发 送 者 1; 必须 偏好 于 说 出 真实 情况 , 从 而 
使 接收 者 选择 行动 a, 而 不 芋 意 说 入 以 诱 使 接收 者 选择 行动 a;。 所 以 , 当 
BRS «Sz: 且 y 委 也 时, 才 存在 分 离 均衡 。 


图 4.3.1 


我 们 的 第 二 个 例子 是 克 劳 福 德 和 索 贝尔 模型 的 一 种 特殊 情况 。 现 在 类 
型 \ 信 号 和 行动 空间 都 是 连续 的 ;发送 者 的 类 型 在 0 到 1 的 区 间 内 均匀 分 布 
{正式 地 ,本 =[0,1] 且 对 所 有 的 E T, p T) = 1); 信 号 空间 即 为 类 型 空间 
(CM = 工 ); 行 动 空间 为 0 到 1 之 间 的 区 间 (4 = [0,1])。 接 收 者 的 收益 函数 
为 Ug(t,a) 一 - (a - 1), BRR BW Us(t,a)= 一 fa-(e+ 
6) 了 ,从 而 发 送 者 的 类 型 为 : 时 ,接收 者 的 最 优 行动 为 a。=:, 但 对 发 送 者 来 
讲 ,最 优 行为 都 是 < = :+5。 也 就 是 说 ,不 同类 型 的 发 送 者 对 接收 者 行为 的 
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偏好 不 同 ( 具 体 地 讲 , 较 高 的 类 型 偏好 的 行动 也 较 高 ), 并 且 参 与 者 双方 的 偏 
好 并 不 是 完全 对 抗 人 性 的 《具体 地 讲 ,参数 >0 和 衡量 参与 者 偏好 的 一 致 
性 一 一 当 b 更 接近 于 0 时 ,参与 者 的 利益 更 为 一 致 )。 

克 劳 福 德 和 过 贝尔 证 明 这 一 模型 (以 及 与 之 相关 的 许 黎 类 型 的 模型 ?所 
有 的 精炼 中叶 斯 均衡 等 价 于 以 下 形式 的 部 分 漫 同 均衡 :类 型 空间 被 分 割 为 
n 个 子 区 间 ,[(0, z1), [zt 22), °°, 【zs -1 11,…; 属 于 某 一 给 定 区 间 的 所 
有 类 型 都 选择 同样 的 信号 ,但 展 于 不 同 区 间 的 类 型 所 选择 的 信号 也 不 相同 。 
前 面 已 经 提 到 , 混同 均衡 (2 =1) 总 蚌 存 在 。 我 们 将 证 明 , 给 定 偏 好 程度 参 
数 b, 存在 一 个 能 够 在 均衡 中 出 现 的 区 间 数 (或 称 “ 段 数 ") 的 最 大 值 ,用 n” 
(HORR, 并 且 对 每 一 个 n =1,2,…， afp) 都 存在 部 分 混同 均衡 。 随 的 
降低 , 可 使 n* (6) 提 高 一 一 从 这 一 点 来 说 , 当 参 与 者 的 偏好 分 布 更 为 一 致 
BY, 通过 空谈 就 可 以 达到 更 好 的 沟通 。 同 时 ,对 所 有 5>0,a (5) 都 是 有 限 
È: b BT Oo, n” (5) 趋 于 无 穷 大 一 一 只 有 当 参 与 者 的 偏好 完全 一 
致 时 , 才 可 能 达到 完全 交流 。 

本 节 的 最 后 , 我 们 分 析 上 述 部 分 混同 均衡 的 特征 , 首先 用 两 段 均衡 (an 
=2) 进 行 说 明 。 假 设 在 区 间 [0, zi) 的 所 有 类 型 选择 一 种 信号, 而 属于 区 间 
[x1;1] 的 选择 另 一 种 信号。 接收 到 属于 区 间 [0, x1) 的 类 型 发 送 的 信号 后 ， 
接收 者 将 推断 发 送 者 的 类 型 在 [0, x,) 上 均匀 分 布 ,于 是 接收 者 的 最 优 行动 
将 是 zi72; 类 伺 地 ,接收 到 属于 区 闻 [zi,1] 的 类 型 发 送 的 信号 后 , 接收 者 的 
服 优 行动 将 为 (zi + 1)/2。 为 使 [0, zt] 中 的 类 型 愿意 选择 他 们 的 信和 号, 必 
须 满 足 区 间 中 的 所 有 类 型 和 (zi + 1)/2 相 比 ,更 偏好 x1/2; 类 似 地 ,所 有 ox, 
之 上 的 类 型 在 (xi1+ 和/2 和 x, /2 中 ,更 偏好 (zf+1)772。 

因为 发 送 者 的 偏好 在 对 其 而 言 的 最 优 行动 的 两 侧 是 对 称 的 , 如 果 两 个 
行动 的 中 点 超过 了 对 他 所 性 类 型 而 言 的 最 优 行动 :+ b CME 4.3.2 所 示 )， 

中 点 


(w+ /2 
1 
1 
4 

a=0 k a=1 
i 


U,(t.a) 
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和 (zi+1)/2 相 比 , 他 会 更 偏好 oe /2 MAR + b 超过 了 中 点 , 则 葛 偏 好 
(2, +D/2, RZ, BRAGG, x, 所 表示 的 类 型 +, 其 最 优 行 动作 
须 怡 好 等 于 两 个 行动 的 中 点 : 


i £ xı +l 
zi+6= 了 [了 + ] 或 x, = (1/2) 一 25 


由 于 类 型 空间 为 工 = [0,1],z AVAE, TRARY SRAM O<1/4 
时 存在 ;因为 b214 时 ,参与 者 的 偏好 过 于 不 一 致 ,以致 于 这 种 非常 有 限 
的 交流 也 无 法 达成 。 

为 完成 对 这 一 两 步 均衡 的 讨论 ,我们 再 来 看 处 于 均衡 路 径 之 外 的 情况 。 
克 劳 福 德 和 索 册 尔 通过 指定 发 适 者 的 (混合 ?战略 .使 得 不 存在 均衡 之 外 的 
信和 号 :所 有 上 < zi 的 类 型 根据 [0, x ] 土 的 均 名 分 布 随 机 选择 一 个 信号 ;所 有 
ta, 的 类 型 根据 [xz,1] 上 的 均匀 分 布 随机 选择 一 个 信和 导 。 出 于 我 们 假定 
M = 工 ,均衡 中 也 就 不 存在 肯定 不 会 被 选择 的 信和 号, 于 是 接收 者 在 所 有 可 能 
信和 号 之 后 的 推断 由 信和 号 要 求 3 决定 ;观测 到 任意 [0, r ] 间 的 信号 后 , 接收 
者 的 推断 为 : 在 区 但 [0, x1] 均 匀 分 布 ;观测 到 任意 [x1,1] 间 的 信号 后 , 接 
收 者 的 推断 为 上 在 区 间 [zxzi,1] 均 名 分 布 ( 在 发 送 者 混合 战略 中 使 用 均匀 分 
布 完全 不 同 于 对 发 送 痢 类 型 均匀 分 布 的 假定 ;发 送 者 的 混合 战略 也 可 以 运 
用 相同 区 间 上 其 他 任何 严格 正 的 概率 分 布 )。 作 为 对 克 劳 福 德 和 索 贝 尔 方 
法 的 一 种 变化 ,我们 可 以 指定 发 送 者 的 一 个 纯 战 略 , 同时 选择 接收 者 对 均衡 
路 径 之 外 信号 的 合适 的 推断 。 例 如 , 令 发 送 者 的 战略 为 所 有 < ri 的 类 型 
选择 信号 0, 且 所 有 te, 的 类 型 选择 信和 号 x1; 同 时 令 接 收 者 观测 到 [0， 
zt] 间 的 信号 时 推断 上 在 [0, zj 区间 服从 均 名 分布, 观测 到 [x1, LIS 
号 时 推断 i 在 区 间 服 从 均匀 分 布 。 

为 摘 述 一 个 n BHA, 我 们 重复 应 用 下 面 从 两 段 均 衡 中 观测 到 的 结 
果 : 上 面 的 一 段 [z1,1] 比 下 面 的 一 段 [0, x11 要 长 45。 这 一 观测 针 果 可 根据 
以 下 事实 得 出 :给 定 发 送 者 的 类 型 (;), 对 发 送 者 而 言 的 最 优 行动 (1: + 5) 比 
接收 者 的 最 优 行动 (2 ) 高 出 b WA, 如 果 相 邻 两 段 的 长 度 相 等 , 两 段 之 间 
Ey Nicks FF JS eS REPA x1) 就 会 严格 偏好 于 选择 与 上 面 一 段 相 对 应 的 
信号 ;事实 上 , 稍 低 于 临界 值 的 类 型 也 会 有 相同 的 偏好 。 使 临界 类 型 在 两 段 
之 间 没 有 差别 的 惟一 方法 (并 从 而 使 高 于 和 低 于 临界 值 的 类 型 严格 偏 好 各 
自 的 信和 号} 就 是 适当 地 使 上 面 一 段 较 下 面 一 段 稍 长 一 些 ,具体 证 明 如 下 : 

MOR lay. ] 段 的 长 为 c( 即 x 一 xz-1 二 <), 则 接收 者 与 此 段 相应 的 
最 优 行动 (具体 地 讲 , 即 (zx + zi-1)/2) 要 比 痢 界 类 型 zk 的 最 优 行动 (具体 
HLF, Atay toC) + 6. 为 使 临界 类 型 z EMAR LL a), rs ] 和 和 
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(a on ALAR, 接收 者 与 后 面 一 段 相 应 的 最 优 行动 必须 比 zx 的 最 优 
行动 高 出 (c/2) +b: 
Tati trr 
2 
从 丽 证 明了 每 一 段 都 比 于 一 段 长 出 45。 
在 = 段 均衡 中 ,如 果 第 一 段 的 长 度 为 d, 则 第 二 颖 的 长 必须 为 d + 46, 
第 三 段 的 长 为 d + 85, 如 此 等 等 。 第 上 RMS Te =1 处 结束 ,于 是 必 
定 有 : 


—Ca,+ 4} 二 sé 或 1 


d+(d+46)+--+idt(n-1)46)=1. 
ASMA MAR 1424-4 (n 一 1)= nln -1)/2, 我 们 得 到 
neodtntn—1)°26=1. (4.3.2) 
给 定 满足 afa-1l) 26<1 的 任意 ”都 存在 一 个 d 的 值 满 足 {4.3.1)。 也 
就 是 说 ,对 n(n —1)-26<1 的 任意 n, 都 存在 一 个 n 段 部 分 混同 均衡 , 并 
且 其 第 一 段 的 长 度 为 满足 (4.3.1) 式 的 相应 的 d 值 。 由 于 第 一 段 的 长 度 必 
须 是 正 的 ,这 一 均衡 中 , 分 眉 的 最 大 可 能 数 ,n" (5), 为 使 nln 一 1):25<<1 
的 最 大 的 n fi. BHO KAR RRA AAT un’ (5) 为 小 于 [1l++ 
+(2/6)]/2 的 加 大 的 整数 。 它 与 在 两 段 均 黎 中 推导 的 结论 是 一 致 的 ， 
BI b14 BT, n” (5)=1: 如 果 参 与 者 间 的 偏好 过 于 不 一 致 , 则 不 可 能 发 
生 交 流 。 还 有 就 是 前 面 讲 过 的 , n” (8) 随 5 的 递减 而 增 大 ,但 只 有 当 上 45 趋 
于 0 时 才 欧 于 无 窃 ; 当 参与 者 的 偏好 更 为 一 致 时 , 会 发 生 更 高 程度 的 交流 ， 
但 只 有 在 参与 者 的 偏好 完全 一 致 时 , 才 可 能 达成 完全 交流 。 


4.3.B 非 对 称 信 息 下 的 序 贰 谈判 


考虑 企业 与 工会 就 工资 问题 进行 谈判 的 情况 。 为 简化 分 析 , Be 
的 工人 数 是 一 定 的 。 工 会 的 保留 工资 (reservation wage )( BI L&R ARS 
亡 寺 该 企业 时 仍 可 获得 的 收入 ) 为 wo 企业 的 利润 用 表示 , 服 共 区 间 
[r xy] 上 的 均 名 分布 ,但 x 的 真实 值 却 为 企业 的 私人 信息 ,例如 企业 在 新 
产 而 计划 阶段 就 掌握 一 些 普通 工人 不 知道 的 徊 识 。 我 们 假定 w, = xz = 0， 
以 使 表示 更 为 简明 。 

谈判 博弈 最 多 持续 两 个 时 期 。 在 第 一 个 时 期 , 工会 给 出 工资 要 价 w, 
如 果 企 业 接 收 访 要价, 则 搏弈 结束 :工会 的 收益 为 w 企业 收益 为 x 一 wi 


〈 净 ) 利 润 的 现 值 )。 如 果 企 业 拒绝 要 价 , 博弈 进入 第 二 时 期 ,工会 给 出 第 二 
TLEZ HY w;。 如 果 企 业 接受 这 一 要 价 则 参与 双方 的 收益 现 值 分 别 为 
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(FES — ATA OE): ES dw 企业 6(x 一 w), 这 里 的 5 Em TR 
因素 ,又 体现 出 因 谈 判 延 长 使 有 效 的 合同 期 较 第 一 期 变 短 而 带 来 的 收益 减 
少 。 如 果 企 业 拒 绝 工 人 的 第 二 个 要 价 , 则 博弈 结束 , 双方 参与 者 的 收 瘟 均 为 
人 0。 在 更 为 现实 的 模型 中 , 可 能 会 允许 谈判 一 直 进 行 下 去 ,直至 达成 一 致 ,或 
者 在 长 时 间 的 墨 工 之 后 ,强制 双方 遵 竺 有 约 东 力 的 仲裁 结果 ,参见 索 贝 尔 和 
高 桥 (1983) 及 习题 4.12 中 对 无 限 博 况 的 分 析 。 

在 这 一 模型 中 ,定义 及 推导 精炼 贝 叶 斯 均 守 稍微 有 些 复 杂 , 但 最 终结 果 
却 很 简单 , 又 十 分 直观 ,因此 我 们 首先 给 出 此 博弈 惟一 的 精炼 贝 叶 斯 均衡， 
并 由 此 开始 进行 分 析 。 

。 工会 第 一 时 期 的 工资 要 价 为 


» _ (2-6)? 
w 2(4-38)"8 * 
。 如 果 企 业 利 润 x 超出 
._ 2w, 2-6 


m 9-8 4-36°" 
则 企业 接受 wl SSM, 企业 拒绝 wr 。 
* 如 果 第 一 期 的 要 价 被 拒绝 ,工会 覆 校 其 对 企业 利润 的 推 斯 :工会 推 
Bx EALO, wf ] 区 间 的 均匀 分 布 。 
* 工会 第 二 期 的 工资 要 价 ( 在 wy 被 拒绝 的 条 件 下 ) 为 


~_™% 2-8 4 
w T2430) HS wt 

， 如 果 企 业 利润 高 于 wz , 则 企业 接受 要 价 , 否则 便 拒绝 。 - 
HB ER, BAERS TSO, TRAM EWES, HA 
工会 第 二 期 的 推断 反映 出 高 利润 企业 将 会 接受 第 一 期 要 价 的 事实 。 CAE 
意 ,这 里 用 词 方 商 的 细微 变化 , 我 们 茎 可 以 指 一 家 企业 有 许多 可 能 的 利润 类 
型 ,有 可 以 指 多 家 企业 各 有 不 同 的 利润 水 平 ,) 在 均衡 条 件 下 , 低 利 润 企业 
恺 受 一 个 时 期 的 黑 工 , 以 联 低 工会 第 二 期 的 工资 要 价 。 不 过 , 利润 非常 
低 的 企业 发 现 , 即使 第 二 期 降低 了 的 工资 要 价 仍然 过 高 , KES, 便 再 
次 拒绝 。 

以 上 我 们 描述 了 参与 者 的 战略 及 推断 , 下 面 我 们 定 祥 博弈 的 精炼 贝 叶 
wit. E 4.3.3 RET PARA HT RAB: RAAT x ay 
Ae). 且 工 会 的 工资 要 价 也 只 有 两 种 可 能 (er 和 wy). 

在 这 一 简化 后 的 博弈 中 , 工会 有 三 个 轮 到 它 行动 的 信息 和 集 , 所 以 工会 的 
战略 也 包含 三 个 工资 要 价 : 第 一 期 的 要 价 wo, 和 两 个 第 二 期 的 要价 ;在 w 
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Bia 
Ry xi 
-pt 
tpl 一 一 一 -U- 一 一 一 P 
Wy w Wy w, 
F F F F 
A, R, R, A, A, R, R, A, 
w t 
Ri iy Re- W, Fe- Way n, -w 
ac —— -4 u- AT" 
Wy wi Wy w, 
F F F F 

Ay R A Rej- h -AR A R, 

w Q u 
Ry Wy 0 Rp- w Ò | ry- we 0 m-t 0 

irl —— ee eye ee [i-r} 
Wy w, Wy w, 
F F F F 

A, R A R, Ay R A R 

w 0 w 3] w 0 m 

fan Wy ü Ry, - BD, 0 Ry =, 0 m-i 0 

4.3.3 


= wy 被 拒绝 后 的 wz 及 在 w= w, 被 拒绝 后 的 w2。 这 三 个 行动 在 三 个 非 
单 节 信息 集 进行 , 工会 在 其 中 的 推断 分 别 表示 为 (p,1 一 户 ),(q,1 一 g) ,及 
(r+,1 一 +)。 在 完整 的 博 穿 (而 非 像 4.3.3 所 示 的 简化 后 博弈 ) 中 , 工会 的 一 
个 战略 是 第 一 期 的 要 价 wi FS AR eR wo), 该 函数 表示 在 
每 一 种 可 能 的 要 价 w, 被 拒绝 后 的 ww，。 这 些 行动 都 发 生 于 非 单 节 的 信息 


i74 (38 re aeRH 


集 , 对 工会 可 能 提出 的 每 一 个 不 同 的 第 一 期 工资 要 价 都 有 一 个 第 二 期 的 信 
TRTE, 这样 的 信息 集 是 连续 存在 的 ,而 不 像 图 4.3.3 中 只 有 两 个 }。 在 
第 一 期 惟一 的 信息 上 集 以 及 第 二 期 连续 信息 集中 ,针对 每 一 可 能 的 x 值 都 有 
一 个 决策 结 ( 于 是 ,这 样 的 决策 结 也 是 连续 的 , 而 非 图 4.3.3 中 只 有 两 个 )。 
在 每 一 信息 集中 ,工会 的 推断 为 这 些 决 策 结 的 概率 分 布 。 在 完整 的 博弈 中 ， 
我 们 用 main 表示 工会 第 一 期 的 推断 ,用 jotrlw1) 表 示 ( 第 一 期 要 价 zi 
被 拒绝 后 ) 工 会 第 二 期 的 推断 。 

企业 的 一 个 战略 包 售 了 两 个 决策 { 在 简化 的 和 完整 的 博弈 中 都 是 一 样 
AI). PARE A KE xit, RS ME wi & Alwil 
MEF 1 如果 企 业 利润 水 平 为 x 并 将 拒绝 w 时 , 则 等 于 0。 类 似 地 , 如 果 
企业 利润 为 r, 且 第 一 期 的 要 和 价 为 wml, 企业 愿意 接受 第 二 期 的 要 价 w;, > 
Alwil r, wie F 1, ASF PEE we, WS Altlar, tw1) 等 于 
0. sed —T ee At eB A Cw |), Az( wln, ny]。 由 于 在 博弈 
的 全 过 程 中 企业 都 有 完全 信息 , 其 推断 也 就 不 必 讨 论 了 。 

MERR wi, wiw D JML Ay wila), Az wale, ri 以 及 推断 [mi 
(x), pz) 满足 第 4.1 节 给 出 的 要 求 2.3、4, 则 构成 一 个 精炼 贝 叶 斯 
均衡 (只 村 工会 的 推断 存在 ,就 满足 要 求 1), 我 们 将 证 明博 弈 存在 惟一 的 精 
炼 贝 叶 斯 均衡 。 论 证 最 简单 的 步骤 是 将 要 求 2 用 于 企业 第 二 阶段 的 决策 
Alwin, wii: 由 于 它 是 博弈 的 最 后 一 步行 动 .企业 的 最 优 闫 策 为 当日 仅 
Á e w: 时 ,接受 ws, 而 与 wi 的 大 小 无 关 。 确 定 了 企业 战略 的 这 一 部 
分 ,再 把 要 求 2 用 于 工会 第 二 期 对 工资 的 要 价 就 十 分 简单 了 :对 给 定 的 工会 
的 推断 gotzl wii) 各 企业 随后 的 战略 At wl, wy), wo 应 使 工会 的 期 望 
收益 最 大 化 。 论 证 比较 困难 的 部 分 则 在 于 确定 推断 jez (al wi), PRER 
如 下 : 

开始 时 ,我 们 先 息 时 考虑 如 于 的 单 期 谈判 问题 { 在 后 面 我 们 将 把 这 一 癌 
题 的 结果 作为 两 期 问题 中 第 二 期 的 解 )。 在 单 期 问题 中 , 假设 工会 的 推断 为 
企业 利润 水 平 服从 [0, wi] 区 间 的 均 名 分布, 这 里 暂时 令 a BER. MR 
工会 要 价 w 则 企业 的 最 优 反 应 是 十 分 明显 的 : 当 且 仅 当 x> w HR w, 
那么 ,工会 的 问题 就 可 以 表示 为 ， 

maxw * Prohi 企 业 接 受 wi +0-Probj EHE wi. 
ik BT AS TES pt REHN, OS w <n Prob] EEEE wl = Cy 
一 wif tro 最 优 的 工资 要 价 则 为 w” {x ) = m/e 
现在 我 们 (永远 地 }) 回 到 两 期 间 题 。 首 先 我 们 证 明 , 对 任意 值 的 w 和 
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，w2; 如 果 工 会 第 一 期 的 要 价 为 wwi, 并 且 企业 希望 其 在 第 二 期 的 要 价 为 w:, 
则 所 有 利润 足够 高 的 企业 将 会 接受 w, 而 其 他 情况 下 拒绝 w 企业 接受 
wo, 可 得 的 收益 为 x- ao 拒绝 we, 但 接受 w 的 收益 为 8Cr- w), ATE 
价 都 拒绝 的 收益 为 0, 从 而 当 x > wy > Cae — we) BE 


wy — Fw 
n> See" Cw), w) 


Bt, Mw. 相 比 , 企业 更 偏好 接受 we, Baw, >o tt, AAT SHR 
HAE, bb ES wo 也 就 是 说 , 对 任意 值 的 wy P w > max 
tm” Cae, w) wet 的 企业 将 接受 wp 且 n< max! x” Cwi w), w iJ E 
业 将 拒绝 wio ITER? 限定 了 对 给 定 的 参与 者 的 后 续 的 战略 , 企业 应 该 
选择 最 优 行 动 , 我 们 可 以 对 任意 值 的 wi 导出 Ay (wey |e) > mariar" (wy, 
we), wl 的 企业 将 接受 w, H r< malla” (wy, we), wi1 的 企业 将 拒绝 
wit, 这 里 的 ws 为 工会 第 二 期 的 工资 要 价 ww2(rw1)。 

现在 我 们 可 以 推导 lr wi), ER MEH w, 被 拒绝 工会 进入 第 二 
期 信息 集 时 持 有 的 推断 。 要 求 4 意味 着 正确 的 推断 应 该 为 r 服 从 [0, r 
(xu1)] 区 间 的 均匀 分 布 ,这 里 的 xf w1) 表 示人 企业 对 接受 w, 和 拒绝 w 但 接 
受 工会 第 二 期 的 最 优 要 价 一 一 地" ini w D = arle) 无 差异 时 的 x 值 ， 
第 二 期 的 最 优 要 价 为 前 面 讨论 单 期 问题 时 的 结果 。 为 理解 这 一 结果 , 回顾 
要 求 4 限定 工会 的 推断 应 该 出 贝 叶 斯 法 囊 和 企业 的 战略 新 决定 。 那 么 ,给 
定 托 才 推出 的 企业 战略 的 开始 部 分 A (wi la), 工会 的 推断 必须 是 , 如 果 进 

入 到 第 二 期 ,企业 的 类 型 服从 [0, x ] 区 间 上 的 均 名 分布 ,其 中 ri = maxi a” 
(wi, w) wii E w? 为 工会 第 二 期 的 工资 要 价 wal wije 给 定 这 样 的 推 
断 , 工 会 最 优 的 第 二 期 要 价 一 定 是 w” Oo) =x( wi)12, 据 此 可 以 得 到 志 tE 
HATE w, HBR: 
xy = max| r" lwm 2), wil . 

HRA — RAR, 假设 w ar” (wp 0/2), WA m = w 但 这 与 w 
a” (4, xi/2) 相 矛盾 。 从 而 wy <a" Cee, riA2)， on x" (wy, 1/2 


Zwi 


my (wi) = é 且 wl w) = 


2- 3o 

现在 我 们 已 经 把 博弈 简化 为 工会 的 一 个 单 期 最 优化 问题 :给 定 工会 的 
第 一 期 工资 要 价 w 我 们 已 明确 了 企业 第 一 期 的 最 优 有 反应 ,工会 在 进入 第 
二 期 时 的 推断 ,工会 第 二 期 最 做 要 价 以 及 企业 第 二 期 的 最 优 反应 , 那么, 工 
会 选择 的 第 一 期 工资 要 价 应 该 满足 
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max wi*Prob| 企 业 接受 wi 


+ wl w). Probi eR ae Wis 但 接受 woal 
+ 8-0°Probj EHEHE ww, 并 拒绝 wal 
请 注意 Probi PUES wi! 并 非 简单 地 等 于 超出 w 的 概率 ,而 应 该 是 
超出 miw BY) EB 
Prob | tike wis BC) 
这 一 最 优化 问题 的 解 为 wl, CEST AR, Bal 和 mz 分 别 由 
malwr FA w (wi ) 给 出 。 


4. 3.C 有 限 重 复 四 徒 困境 中 的 声誉 


在 第 2.3.A 节 对 有 限 重 复 完全 信息 博弈 的 分 析 中 , 我 们 证 明了 如 果 一 
SRR BAA HATH, WEF RBH AAR AA 
ye — OS TERS CS RB, ahs Pa 
重复 阶 疏 博弈 的 纳什 均衡 。 但 与 这 一 理论 结果 相反 ,大 量 的 经 验证 据 表 明 ， 
在 有 限 重 复 囚 徒 困境 中 经 常会 出 现 合作 结果 , 特别 是 在 距 博弈 结束 仍 比 较 
远 约 阶段 ;参见 阿 克 塞 尔 罗 德 (Axelrod,1981) 提 殿 的 资料 。 克 雷 普 斯 .米尔 
格 龙 条 威 尔 避 (198217 证 明 声 准 寞 型 (reputation model) 可 为 此 现象 提供 合理 
的 解释 。 了 

对 有 限量 复 因 徒 困境 中 的 这 种 声 普 均衡 最 简单 的 展开 项 运用 到 表示 非 
对 称 信 息 的 一 种 新 的 模型 。 我 们 不 再 假定 某 方 参 与 者 享有 关于 他 自己 收益 
的 私人 信息 ,而 假定 有 的 参与 者 享有 关于 他 自己 可 选择 战略 集 的 私人 信息 。 
Bik ain, 我 们 将 假定 行 (row) 参 与 者 只 能 选择 “* 投 桃 报 李 "”(Tit-for-Tat)“" 
战略 ( 它 可 使 重复 博弈 以 相互 合作 开始 并 在 其 后 模仿 对 方 的 行动 ) 的 概率 为 
p. 而 行 参 与 者 可 以 选择 完全 信息 重复 博弈 中 任意 可 行 的 战略 (包括 “ 投 桃 
报 李 ") 的 概率 为 1- p。 按 通常 说 法 , 我 们 称 后 一 种 类 型 的 行 参 与 者 为 “ 理 
性 的 "。 这 种 方式 在 表达 上 的 优点 在 于 一 旦 行 参与 者 偏离 了 “ 投 桃 氢 李 "的 
战略 , 则 行 参与 者 是 理性 的 就 成 为 共同 知识 。 


O 我 们 在 筑 2.3.B 节 已 证 明 在 无 很 重复 囚徒 功 境 特 弈 中 可 以 达成 合作 , 一 些 学 者 称 这 种 均 
守 为 * 声 着 "均衡 ,即使 双方 参与 者 的 收益 和 机 会 帮 是 共同 知识 。 为 与 此 相 区 分 , ROL 
ae Re ae 而 把 * PE ARE TREE, 即 至 少 有 一 方 枯 与 者 不 了 解 
别 一 方 所 掌 择 的 全 部 知识 。 

* ”这 里 的 英文 愿意 是 “针锋相对 ", 译 作 " 投 枢 扳 李 " 是 强调 其 相互 合作 的 帝 思 。 一 一 译注 
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RARE RBA THE, RES. FN, 它 还 是 阿 克 塞 尔 罗 德 关 
于 囚徒 困境 的 竞赛 中 的 优胜 战略 。 然 而 ,也 许 有 人 会 认为 ,假定 某 参 与 者 只 
有 一 种 可 行 战 略 不 能 合理 ,即使 它 是 非常 其 有 吸引 力 的 战 路 。 以 表达 上 不 
再 那么 简单 为 代价 ,也 可 以 假定 双方 参与 者 都 可 以 选择 任意 战略 ,但 行 参与 
者 的 收益 为 私人 信息 , 是 投 桃 报 李 严格 优 于 另外 任何 战略 的 概率 为 p。( 在 
这 一 假定 下 , 表达 变 得 复杂 了 , 是 因为 偏离 投 桃 报 李 战略 不 再 能 使 行 参与 者 
是 理性 的 成 为 共同 知识 。) 上 面 的 收益 与 重复 博弈 中 典型 的 假定 不 同 :为 使 
模仿 列 参 与 者 的 前 阶段 战 路 成 为 最 优选 择 , 行 参与 人 的 在 一 个 阶段 的 收益 
必须 依赖 于 列 参与 人 前 一 阶段 的 行动 。 作 为 第 三 种 可 能 性 (同样 以 表达 上 
的 复杂 为 代价 ), 也 可 以 允许 一 方 参与 者 的 阶段 博弈 中 的 收益 为 私人 信息 ， 
但 同时 强调 一 个 阶段 的 收益 只 依赖 于 本 阶段 的 行动 , 并 且 重 复 博弈 的 总 收 
益 等 于 阶段 博 舒 的 收益 之 和 。 具 体 地 说 ,我们 可 以 假定 参与 人 对 合作 的 最 
优 反应 是 合作 的 概率 为 户 。 克 震 普 斯 .米尔 格 龙 和 威 尔 避 (此 后 简称 为 
KMRW ) 证 明 这 种 类 型 的 单方 非 对 称 信息 并 不 能 成 为 导致 合作 均衡 的 充分 
条 忻 , 而 且 每 一 阶段 都 会 出 现 坦白 ,与 在 完全 信息 下 的 情况 相同 。 不 过 , 他 
们 还 证 明 , 如 果 存 在 相同 类 型 的 双方 非 对 称 信息 ( 即 , 如 果 同 样 列 参与 者 对 
合作 的 最 优 反 应 是 合作 的 概率 为 p), 则 存在 一 个 合作 均衡 ;双方 参与 者 相 
互 合作 ,直至 博 蛮 的 最 后 很 少 几 个 阶段 为 止 。 

在 以 下 的 分 析 中 , 我 们 将 假定 参与 者 只 能 能 选择 投 桃 报 李 战略 的 概率 
Ap. KMRW 的 分 析 中 心 在 于 :即使 p 非常 小 ( 即 : 即 使 列 参 与 人 只 稍微 
有 一 点 怀疑 行 参与 人 可 能 是 非 理 性 的 ), 这 种 不 确定 性 也 可 以 产生 很 大 的 效 
果 , 可 从 下 面 几 方面 来 理解 。KMRW 证 明 存 在 一 个 阶段 数 的 上 限 , 在 这 之 
肉 驭 方 的 均衡 行为 都 是 坦白 ,这 一 上 限 决 定 于 p 的 大 小 和 阶段 博弈 的 收益 
情况 ,而 与 重复 博弈 中 的 阶段 数 无 关 。 那 么 ,在 一 个 足够 长 的 重复 博弈 任何 
均衡 中 , 双方 参与 者 相互 合作 的 阶段 所 占 部 分 就 会 很 大 (KMRW REFR 
均衡 的 条 件 下 表述 其 结论 的 ,但 他 们 的 论证 同样 适用 于 精炼 贝 叶 斯 均衡 )。 
KMRW 论证 中 关键 的 两 步 为 (i) 如 果 参 与 者 一 旦 背离 了 “ 投 桃 报 李 ”战略 ， 
则 行 参 与 人 为 理性 的 就 成 了 共同 知识 , 于 是 此 后 就 不 会 有 参与 者 再 选择 合 
fF, 于 是 理性 的 行 参 与 人 就 有 动机 去 假扮 “ 投 桃 报 李 "类 型 ;(ii) 对 下 面 给 定 
的 关于 阶段 博弈 收益 情况 的 假定 , 列 参与 人 对 “ 投 桃 报 李 " 的 最 优 反应 为 相 
互 合作 ,直至 博弈 的 最 后 一 个 阶段 。 

为 了 给 KMRW 模型 中 的 内 在 机 制 提供 一 个 简单 说 明 , 我 们 下 面 考 虑 
其 分 析 的 互补 情况 :不 再 假定 p 非常 小 并 分 析 长 时 期 重复 的 博弈 ,而 假定 
户 足 够 大 ,使 得 在 一 个 短期 重复 博弈 的 均衡 中 , 双方 参与 者 除了 最 后 两 个 阶 


得 
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Be 2 Shab FEARS He ILA BT BT Be 89 TPL FP RG or HY, A A A : 

1. 自然 为 行 参 与 者 赋 子 一 种 类 型 。 行 参与 者 只 能 选择 * 极 桃 报 李 " 战 
略 的 概率 为 p, 可 坟 选 择 任意 战略 的 概率 为 1 -pp。 行 参与 者 了 解 
他 的 类 型 , 但 列 参 与 者 不 知道 行 参与 者 的 类 型 。 

2. 行列 参与 者 进行 网 传 瑟 境 博 羡 ,双方 参与 者 在 这 一 阶段 中 的 选择 
为 共同 知识 。 

3. 行 、 列 参与 者 第 二 次 , 也 是 最 后 一 次 进行 四 徒 困境 博弈 。 

4. 双方 得 到 各 自 的 收益 。 理 性 行 、 列 参与 者 的 收益 为 各 自 阶 段 博 弈 的 
收益 之 各 {不 考虑 贴现 )}。 阶 段 博 穿 由 图 4.3.4 给 出 。 


为 使 这 一 阶段 博弈 成 为 因 徒 困境 ,我 们 假定 a >t H b<0 KMRW 同时 还 
假定 a + 玫 2, 这 使 得 (如 上 面 ( 刘 中 所 要 求 的 ) 直 至 博弈 的 最 后 一 个 阶段 之 
前 ,对 投 槛 报 率 的 最 优 反 席 都 是 进行 合作 , 市 不 在 合作 和 坦白 之 间 相 互 转 
移 。 

和 在 完全 信息 有 限 重 复 囚徒 困境 中 最 后 一 个 阶段 的 博 况 相同 , 在 这 里 
的 两 阶段 非 完 全 信息 博弈 的 第 二 阶段 ,坦白 (F}) 也 严格 优 于 合作 (CY), 这 对 
理性 的 行 参与 者 积 列 参与 者 是 一 样 的 。 由 于 列 参 与 者 肯定 在 最 后 一 个 阶段 
选择 盘 和 ,对 理性 的 行 参 与 者 来 说 ,也 没有 尾 何 理由 在 第 一 阶段 选择 合作 。 
最 后 , 投 桃 报 李 的 战略 使 搏弈 始 于 相互 合作 , 那么 , 需要 确定 的 惟一 行动 便 
是 列 参与 人 第 一 阶段 的 行动 (X), 它 将 在 第 二 阶段 因 投 桃 报 李 而 被 模仿 ,如 
图 4.3.5 Atm. 


Peet es Cc X 
理性 行 参与 人 F F 
agg A x F 


图 4.3.5 
通过 选择 X= C, 列 参与 者 在 第 一 阶段 得 到 期 望 收 益 p-it+(1-p)-6,8 
在 第 二 阶段 得 到 p-a。( 由 于 投 桃 报 李 的 和 理性 的 行 参 与 人 在 第 一 阶段 选 
择 的 行动 不 同 , 列 参 与 人 在 第 二 阶段 开始 时 就 会 知道 行 参与 人 是 投 桃 报 李 
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类 型 的 还 是 理性 的 。 第 二 阶段 的 期 望 收 益 pra 则 反映 了 列 参 与 人 在 湛 定 
第 一 阶段 是 合作 还 是 坦白 时 对 行 参 与 人 类 型 的 不 确定 性 。) 通 过 选择 X= 
F, BLER, 列 参 与 人 第 一 阶段 获得 p-o 并 在 第 二 阶段 得 到 0。 因 此, 下 
式 成 立时 , 列 参 与 人 将 在 第 一 阶段 选择 合作 

pt(ll-p)b20. (4.3.2) 
在 后 面 ,我 们 假定 (4.3.2) 是 成 立 的 。 

We, SRI RMR. BE(4.3.2), 如 困 列 参与 人 和 理性 的 行 参 
与 人 都 在 第 一 和 防 段 选择 合作 , 则 第 二 和 第 三 阶 朋 的 均衡 路 径 将 击 国 4.3.5 
给 出 , 只 需 令 X=- 并 更 改 一 下 阶段 的 表示 数字 。 我 们 将 推导 列 参 与 人 和 
理性 的 行 参 与 人 在 第 一 阶段 相互 合作 的 充分 条 件 , 在 此 条 件 下 三 阶段 的 均 
衡 路 径 如 图 4.3.6 所 示 。 

在 这 样 的 均衡 中 , 理性 行 参 与 人 的 收益 为 1 + a, 列 参与 人 的 期 望 收 益 
Al+p+- pbt pa。 如果 理 性 的 行 参 与 和 在 第 一 阶段 选择 坦白 , MIT 
戎 与 人 是 理性 的 就 成 为 共同 知识 ,于 是 在 第 二 和 第 三 阶段 两 参与 者 部 选择 
坦 和 白 。 那 么 ,理性 行 参 与 人 第 一 阶 息 选择 坦白 可 得 到 的 总 收益 为 a, 它 要 低 
于 均衡 收益 1+ a, 于 是 理性 行 参 与 入 没有 动机 去 背离 图 4.3.6 中 隐 含 的 战 
aS 


RMR C € C 
理性 行人 参与 人 c F F 
HEHA € € F 
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下 面 , RNSRASSABSADMBS. MRASSACH—HB 
就 选择 坦白 , 则 投 桃 报 李 将 在 第 二 阶段 选择 坦白 , 理性 的 行 参与 人 也 将 在 第 
二 阶段 选择 坦白 , 因为 列 参 与 人 肯定 会 在 最 后 阶段 选择 坦白 。 在 第 一 阶段 
HAZE, 列 参与 人 必须 决定 在 第 二 阶段 是 合作 还 是 继续 坦白 。 如 果 列 参 
与 人 在 第 二 阶段 也 坦白 , 则 投 桃 报 李 型 在 第 三 阶段 将 选择 坦白 , TEREK 
进行 将 如 图 4.3.7 所 示 。 列 参与 人 从 这 种 背离 中 得 到 的 收益 为 a, 它 小 于 
列 参 与 人 均衡 的 期 望 收益 的 条 件 为 
1+ pt+(1— pot paxa . 

给 定 (4.3.2), 列 参与 人 不 选择 这 一 背离 战略 的 充分 条 件 为 

I+ praa. (4.3.3) 
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e=1 £ 


投 桃 报 李 c 
理性 行 参与 人 c 
ABSA F 


yoy ty | 


A 4.3.7 
另 一 种 情况 是 , 列 参 与 人 的 背离 战略 可 以 是 在 第 一 阶段 坦白 ,但 在 第 二 
阶段 合作 , 这 时 投 桃 报 李 将 在 第 三 阶段 选择 合作 , 于 是 博弈 的 进行 如 图 
4.3.8, 列 参与 人 这 种 背离 战略 的 收益 为 w+E+ 疡 :aa, 它 小 于 列 参 与 人 均 街 
期 望 收 益 的 条 件 为 
I+ p+Cl—p)b+ paxratht+ pa. 
$3 (4.3.2), 列 参与 人 不 选择 这 一 背离 战略 的 充分 条 件 为 


atb=l1. (4.3.4) 
z=1 1=2 r=3 
投 桃 报 李 € F C 
理性 行 参 与 人 Cc F F 
到 参与 人 F (a; F 
4.3.3 


现在 , 我 们 已 经 证 明 如 果 (4.3.2)、(4.3.3) 和 (4.3.4) 成 立 , 则 图 4.3.6 
描述 的 博弈 进行 为 三 阶段 因 徒 困境 博弈 一 个 精 煤 贝 叶 斯 均衡 下 的 均衡 路 
径 。 对 一 个 给 定 的 p E, 如 果 收 益 a 和 5 的 值 处 于 图 4.3.9 中 的 阴影 部 
分 , 则 满足 这 三 个 不 等 式 。 随 p AT 0, 这 一 阴影 部 分 将 会 消失 , 这 与 前 面 
的 结论 是 一 致 的 , 即 本 节 中 我 们 分 析 上 短期 博弈 中 的 合作 均衡 , CEREK 


a=1/(1—-p) 


=—p/(l-p) 
atb=1 


4.3.9 
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H p fA, iii KMRW 则 重点 分 析 长 期 博弈 且 产值 很 小 的 情况 。 另 一 方面 ， 
如 果 户 值 大 到 足以 支持 短期 博弈 中 的 合作 , 它 的 值 当然 可 以 支持 长 期 博弈 
中 的 合作 。 正 式 地 ,如 果 alo 和 户 满 足 (4.3.2)、(4.3.3) 及 (4.3.4》， 则 
对 和 任意 有 限 的 工 >3, 在 了 阶段 重复 博弈 中 存在 一 个 精炼 贝 叶 斯 均衡 ， 
其 中 理性 的 行 参与 人 人 和 列 参 与 人 直到 本 -2 阶段 之 前 都 选择 合作 , 在 其 
后 的 工 -1 阶段 和 工 阶 段 则 如 图 4.3.5 所 示 。 人 参见 附录 4.3.C 对 这 一 
结论 的 证 明 。 i 


附录 4.3.C 


为 使 般 述 简洁 ,我 们 以 合作 均衡 (cooperative equilibrium) #27 T 期 重 
复 四 徒 困境 中 如 下 的 精炼 贝 叶 斯 均衡 , 即 理性 的 行 参 与 人 和 列 参 与 人 从 博 
弈 开始 直至 T -2 期 全 部 选择 合作 , 并 在 其 后 的 了 -1 期 和 了 期 遵循 图 
4.3.5 所 示 的 路 径 。 我 们 将 证 明 , 如果 ab 和 满足 (4.3.2)、(4.3.3) 各 
(4.3.4), 则 对 所 有 的 工 >3 部 存在 一 个 合作 均衡。 证 明 司 用 数学 归纳 法 : 
如 果 对 每 一 个 *=2,3,…, 工 -1 在 = 期 博弈 中 都 存在 合作 均衡 , 则 在 T 
期 博弈 中 存在 合作 均衡 。 

首先 ,我 们 证 明 在 工期 博弈 中 理性 的 行 参 与 人 没有 动机 育 离 合作 均 
策 。 如 果 行 参与 人 在 :之 TT 一 1 中 的 任 一 阶段 选择 坦白 ,他 是 理 福 的 就 成 准 
共识 ,于 是 行人 参与 人 在 上 期 得 到 的 收益 为 a, 其 后 每 一 期 的 收益 都 为 0。 但 
行 参与 人 的 均衡 收益 为 从 上 到 工 -2 期 每 一 期 都 等 于 1, T-1 期 的 收益 为 


a, 共 为 (T-z 一 1) + a, 于 是 对 任意 的 :< 全 一 1, 坦白 都 无 利 可 图 。 图 
4.3.5 中 的 论证 同时 表明 理性 的 行 参与 人 在 个 一 1 期 及 工期 也 没有 动机 背 
离 。 


其 次 ,我 们 证 明 列 参与 人 没有 动机 背离 。 关 于 图 4.3.5 的 论证 表明 , 列 
参与 人 没有 动机 背离 合作 均衡 战略 , 而 在 T -2 期 之 前 选择 合作 , 并 在 T- 
1 期 选择 坦白 ;关于 图 4.3.6 的 论证 表明 , 列 参与 人 没有 动机 选择 如 下 的 背 
离 战略 :从 开始 直到 本 一 3 期 一 直 合作 ,并 在 T-2 期 坦白 。 从 而 , RA 
需 证 明 列 参与 人 没有 动机 选择 下 面 的 背 高 战略 :从 开始 直到 : -1 期 一 直 合 
作 , 而 在 上 期 姐 白 ,这 里 的 1 所 1 所 TT 一 3。 

如 果 列 参与 人 在 上 期 坦白 , 投 桃 报 李 就 将 在 c+ 1 期 坦白 ,而 理性 的 行 
参与 人 也 将 在 +1 期 选择 坦白 (因为 在 :+1 期 的 阶段 博 穿 中 ,坦白 严格 优 
于 合作 ,在 其 后 从 :+2 到 期 至 少 可 以 得 到 0 的 收益 ,而 在 : +1 期 合作 
将 使 得 行 参与 人 是 理性 的 成 为 共同 知识 ,使 : +2 到 工期 的 收益 只 能 等 于 
0)。 由 于 投 桃 报 李 与 理性 行 参 与 人 在 * 期 之 前 全 都 选择 合作 , 并 都 在 +1 
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期 坦白 , 列 参 与 人 在 上 +2 期 开始 时 的 推 斯 仍 为 行 参与 人 是 投 桃 报 李 类 的 概 
SA po AK 如 果 列 参与 人 在 +1 期 合作 ., 则 从 上 +2 期 开始 的 后 一 部 分 
的 博弈 等 司 于 c= 丁 一 Ct +2)+1 时 和 的 zc 期 博 蛮 。 根据 归 纳 法 的 假定 ,在 这 
后 一 部 分 的 * 期 博弈 中 存在 一 个 合作 均衡 , 假定 博弈 按 此 均衡 进行 。 则 列 
参与 人 通过 在 + 期 坦白 ,而 在 :+ + 1 期 合作 ,从 :到 芽 闪 可 得 到 收益 
a+pbt+[T-(t+2)—-1]+p+ti—- pb+pa. 
它 小 于 列 参 与 人 从 : 到 了 RA eR 
2+[T~-(t+2)—1]+p+(l— pb+ pa. (4.3.5) 

BK, 我 们 已 证 明 列 参与 人 没有 动机 背离 均衡 , 醒 从 开始 到 : -1 期 合 
作 , 在 上 期 坦白 ,并 在 上 +l 期 继续 合作 , 其 前 提 是 在 从 : +2 期 开始 的 以 后 
部 分 的 博弈 按 合作 均衡 进行 。 更 为 一 般 的 , 列 参 与 人 了 世 可 以 从 开始 直至 : 
-工期 合作 ,从 上 到 :+z 期 坦白 ,并 在 上 +3s+1 期 合作 。 先 需 考虑 三 种 特殊 
HRM: (DWR +s = TRISSA BA : 期 坦白 后 再 不 合作 ), WAS 
与 人 在 : 期 收益 六 a, 并 在 以 后 收益 为 0。 等 同 于 (4.3.5);(2}) 如 果 :+s+ 
1=T, 则 烈 参 与 人 人 从 + 期 到 工期 的 收益 为 oa +b, 甚至 更 低 于 情况 (1);(3) 
如 果 1+s+1= 丁 -1, 则 列 参 与 人 从 :+ BT AeA +b + pa, 小 于 
(4.3.5)。 余 下 的 就 是 要 分 析 1 + s4+1< T-1 的 情况 。 和 上 面 ;=0 的 情 
SB, 在 从 1 + s+2 期 开始 的 以 后 部 分 博弈 中 存在 一 个 合作 均衡 , 假定 博 
弈 接 此 合作 均衡 进行 。 则 列 参 与 人 选择 这 一 背离 战略 从 上 到 工期 得 到 的 
收益 为 

atb+[T-—-{(r+t+si+2)—-1]+pt(1- poet pa 

同样 小 于 (4.3.5)。 


4.4 精炼 贝 叶 斯 均衡 的 再 精炼 


在 第 4.1 节 我 们 和 定义 了 精炼 贝 叶 斯 询 衡 为 满足 要 求 1 到 4 的 战略 和 推 
断 , 并 已 知 在 这 样 的 均衡 中 , 没有 参与 者 的 战略 包含 始 于 任何 信息 集 的 严格 
FRR, ME, 我 们 考虑 两 个 更 进一步 的 要 求 ( 关 于 处 于 均衡 路 径 之 外 的 椎 
断 )。 第 一 条 的 形成 出 自 以 下 想法 :由 于 精炼 贝 叶 斯 均衡 排除 了 参与 者 i 选 
择 的 战略 包含 始 于 任何 信息 集 的 严格 劣 战略 的 可 能 性 , 要 令 参 与 者 j 相信 
参与 者 i 将 选择 这 样 的 战略 就 是 不 合理 的 。 l 

为 对 这 一 思想 的 理解 更 为 精确 , 考虑 图 4.4.1 Pe, 其 中 有 两 个 纯 
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PRS Ae LOT ae CLL, p = 1) ACR, R’, pSi/2) PA ATR 
的 特征 在 于 M 为 参与 者 1 的 一 个 严格 劣 战略 ;选择 R 可 得 的 收益 2 超出 
了 参与 者 1 选择 M 可 能 得 到 的 所 有 收益 一 一 0 和 1。 那么 , 要 令 参 与 者 2 
相信 1 可 能 选择 了 M 是 不 合理 的 ;正式 地 ,1 - p 不 可 能 为 正 , 于 是 p 
EFF 1. MRE 1- p> RSH, MCR, R, pSl/2wraARE 
WRI. RAL, L’, p= 1) 成 为 满足 这 一 要 求 的 惟一 的 精炼 
中 叶 斯 均 密 。 


国 4.4.1 


这 一 例子 的 另外 两 个 特征 也 入 得 简要 提 及 。 第 一 , 尽管 M BPRS 
战略 , 工 却 不 是 。 如 果 上 也 是 严格 尘 战 略 ( 比 如 说 1 的 收益 3 换 成 372 时 
的 情况 ), 则 同样 的 论证 意味 着 p 不 可 能 为 正 , 但 这 又 与 前 面 的 结果 p 一 定 
等 于 1 相 牙 盾 。 在 这 样 的 情况 下 ,这 一 要 求 不 限制 参与 者 2 DOMES FS 
的 推断 ; 见 下 文 的 正式 定义 。 

第 二 ,这 一 例子 并 不 是 对 开始 时 描述 和 的 要求 的 精确 说 明 , 因为 M 并 非 
只 从 一 个 信息 集 开 始 成 为 严格 劣 战略 , 而 是 其 本 身 就 是 一 个 严格 劣 战 略 。 
为 理解 其 中 的 区 别 , 回顾 第 1.1.B 节 对 严格 劣 战略 的 定义 : 邵 果 存在 另外 
一 个 战略 si, 使 对 其 他 参与 者 每 一 可 能 的 战略 组 合 , i 选择 s; 的 收益 都 严格 
大 于 选择 ;“ 的 收益 , 则 s' 为 i 的 一 个 严格 劣 战略 。 现 在 , 考 虚 图 4.4.1 中 
博弈 的 一 种 扩展 情况 ,其 中 参与 者 2 在 图 中 1 的 行动 之 前 有 一 次 行动 ,并 在 


D 从 标准 式 表 述 中 可 推导 出 博 凌 存 在 两 个 纯 战 略 纳 什 均 奖 ;( 工 , 和 (RR, RY)。 由 于 在 这 
里 的 扩展 式 中 并 不 存在 子 博弈 , 两 个 纳什 去 奖 都 是 子 博弈 粮 燃 的。 在 tL, 中 .参与 者 2 的 信息 
Ra THRE, TE EREET = 1。 在 { 尺 ,只 ') 中 ,这 一 信息 集 外 于 均 酉 路径 之 外 , ER 
4 并 没有 对 所 进行 任何 限制 ,因此 我 们 只 需要 2 的 推断 使 行动 民 ' 成 为 最 优 一 一 也 就 是 p<1/2. 
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这 最 初 行动 中 有 两 个 选择 , 一 个 使 博弈 结束 , 另 一 个 轮 到 1 在 图 中 1 的 信息 
和 集 选 择 行动 。 在 这 一 扩展 的 博弈 中 , M 仍 从 1 的 信息 集 开 始 成 为 一 个 严格 
佬 战略 ,但 M 不 再 是 整个 博弈 的 严格 劣 成 略 , 因为 如 果 2 在 初始 节选 择 的 
行动 使 博弈 结束 , 则 上, M 和 RR 全 都 只 能 得 到 相同 的 收益 。 

由 于 在 图 4.4.1 中 M 为 严格 劣 战 略 , 令 参 与 者 2 推断 1 可 能 已 经 选择 
了 M 当然 是 不 合理 的 。 但 严格 劣 战 略 这 一 条 件 过 强 ,并 由 此 得 到 的 要 求 
又 太 妮 。{ 因 为 从 一 个 信息 集 开始 成 为 严格 尘 战 略 的 战略 要 多 于 整个 博弈 
的 严格 涯 战略 ,要求 ; 不 相信 i 会 选择 前 一 种 战略 对 j; 推断 的 限制 , BERT 
BOR j 不 相信 i 会 选择 后 一 种 战略 对 其 推 斯 的 限制 .) 在 于 面 ,我 们 仍 使 用 
开始 时 给 出 的 要 求 : 参 与 者 j 不 相信 和 参与 者 i 会 选择 从 任何 信息 集成 为 严 
格 劣 战略 的 战 玫 。 下 面 我 们 给 出 这 一 要 求 的 正式 表述 。 


定义 考 虚 轮 到 参与 者 i 行动 的 一 个 信息 集 。 战 略 六 为 始 干 这 一 信 
BS RM (strictly dominated beginning at this information set), 好 
果 存 在 另 一 个 战略 si 使 得 对 i 在 给 定 信息 集 可 能 持 有 的 每 一 推断 , 并且 对 
每 一 其 他 参与 者 后 续 战 略 可 能 的 组 合 ( 这 里 的 “后续 战略 "(subsequent strat- 
egy), 是 一 个 包含 了 在 达到 给 定 信 息 集 之 后 可 能 会 发 生 的 所 有 情况 的 完整 
的 行动 计划 ), i 在 给 定 信 息 集 根据 5 选择 行动 并 在 其 后 根据 选择 后 续 眠 略 
得 到 的 收益 严格 大 于 根据 *“ 选择 行动 和 后 续 战 略 得 到 的 收益 。 


Bes. 在 可 能 的 情 襄 于 ,在 每 一 参与 者 均衡 路 径 之 外 的 推断 中 , 如 
果 一 个 节点 只 有 在 另 一 参与 者 选择 始 于 某 些 信息 集 的 严格 劣 战 略 时 , 才能 
EAHA, 则 应 认定 到 达 这 一 节点 的 概率 为 0。 

要 求 5 中 的 限定 语 “ 丰 可 能 的 情况 下 ”, 是 考虑 到 类 似 图 4.4.1 中 参与 
者 工 的 收益 3 换 戌 3/2 的 情况 ,这 时 M 和 工 都 劣 于 尺 。 在 这 种 情况 下 ,要 
求 1 要 求人 参与 者 2 持 有 一 个 推断 ,但 又 不 可 能 在 推断 中 令 到 达 M AL 之 下 
的 节点 的 概率 都 为 0. 于 是 要 求 5 不 再 适用 。 

作为 对 要 求 5 的 第 二 个 说 明 , 考虑 图 4.4.2 的 信号 搏弈 。 与 第 4.2. 扩 
节 相 同 , APRESS RR m, m OETAN 选择 信号 m, BÆN ,选择 信 
Bom’ ;接收 者 战略 Ca’, a} 表示 接收 者 在 工 之 后 选择 行动 a ,在 R ZAR 
择 行动 a”。 我 们 可 以 很 容易 地 检验 对 gH 1/2 ,战略 和 推断 [(L, L) Cu, 
d), 户 =0.5,qg] 构 成 博弈 的 一 个 混同 精炼 贝 叶 斯 均衡 。 不 过 , a t 
蹇 的 关键 特征 , 是 令 1, HER 没有 任何 意义 。 正 式 地 ,发送 者 战略 (RR, 工 】) 
ICR, R)—— IREI ¢, 选择 R 的 所 有 战略 为 始 于 发 送 者 对 应 于 类 型 ti 
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3,2 


2,0 


14 


1,1 


HA 4.4.2 


HHA BRP See? 那么 ,只 有 在 发 送 者 选择 了 始 于 一 个 信息 集 的 
严格 省 战略 时 , 才 可 能 到 达 R 之 后 接收 者 的 信息 集中 节点 1:2。 而 且 , 存在 
另外 一 个 始 于 任何 信息 集 的 非 劣 战略 一 一 即 ( 工 ,R), 可 以 在 及 之 后 接收 者 
的 信息 集中 到 达 节 点 ta。 从 而 要 求 5 限 定 g =0。 因 为 只 有 在 o> 1/2 时 ， 
ECL, L), (rz),p=0.5,9] 为 博弈 的 精炼 只 时 斯 均衡 , 此 均 衔 不 能 满足 要 
求 5。 

可 以 针对 第 4.2.A 节 定义 的 信号 博弈 精 炬 贝 叶 斯 均衡 ,将 要 求 5 重 新 
表述 如 下 。 


定义 ”在 信和 号 博弈 中 , M 中 的 信号 m RAT 中 类 型 1 的 劣 信和 号 
(dominated for type #;), 如果 存 在 另外 一 个 信 叶 mj, 使 得 1; 选择 mi 的 最 低 
可 能 收益 大 于 oe; 选择 m, 的 最 高 可 能 收益 : 


min U,C ti mj, ax) >max U,(£;, mir as) . 
a EA ata 


信号 要 求 5 WE m 之 后 的 情 息 集 处 于 均衡 路 径 之 外 , A m 为 类 型 
# 的 省 信号 , 则 (在 可 能 的 情况 下 ) 接 收 者 的 推断 aCe l sm) 中 ,认为 发 送 者 
的 类 型 为 5 的 概率 应 该 等 于 0( 只 要 m, 不 对 工 中 所 有 的 类 型 都 是 省 信和 号， 


中 ”由 于 发 送 者 对 应 于 类 型 n 的 信息 集 为 一 个 单 节 信 息 集 , 在 定义 始 于 这 一 信息 集 的 严格 劣 
战略 时 , 发 送 者 的 推 斯 不 起 任何 作用 。 则 证 明 (RR, 工 ) 和 (RR, RR} 是 始 于 这 一 情 息 入 的 严格 党 战 酷 ， 
只 需 证 明 对 接收 者 的 每 战略, 类 型 5 的 发 送 者 选择 另 一 战略 都 可 以 著 得 更 高 的 收益 。( 上 , RR 
是 这 么 一 个 越 略 : 它 使 得 a 的 最 低 收 益 为 2, 而 {请 ,上 ) 和 (R, 民 }) 给 n 的 最 高 收益 为 1。 


1856 fest re AER 


即 为 适用 这 一 要 求 的 可 能 情况 )。 

在 图 4.4.2 的 博弈 中 ,分 离 精炼 员 叶 斯 均衡 [CL 上 L, R), (gg,n),pP=1,g 
= 一 0] 则 自然 满足 信号 要 求 5 因为 不 存在 这 一 均衡 路 径 之 外 的 信息 集 》。 作 
为 一 个 需 经 检验 才 可 确定 满足 信 叶 要 求 5 的 例子 ,假设 当 类 型 :, 选择 下 
时 , 接收 者 的 收益 为 :选择 4 的 收益 为 1. 选择 u 的 收益 为 0 而 不 再 是 图 中 
JoHN is BT, ICL, LY} Cu, d), 9 =0.5, 9 ERA g 值 都 是 一 个 混同 
精炼 贝 吐 斯 均衡 ,于 是 [(L ,Layd),p=0.5.9g=0] 就 是 一 个 满足 依 导 
要 求 的 洗 同 精炼 只 叶 斯 均衡 。 

在 有 些 博 弈 中 , 存在 看 起 来 不 合 情 理 然而 却 满足 要 求 $ 的 精炼 由 叶 斯 
均衡 。 博 弈 论 的 最 新 研究 中 ,最 为 活 有 乒 的 领域 之 一 便 涉 及 到 如 下 两 个 相关 
问题 :5) 在 什么 铺 况 下 ,一 个 精炼 只 叶 斯 均衡 是 不 合理 的 ; Ci) FE 
定义 中 还 能 够 丙 加 上 哪些 要 求 ,以 剔除 这 些 不 合理 的 精炼 风 叶 斯 均衡 。 起 
和 克 雷 普 斯 (1987) 在 这 一 领域 的 研究 中 作出 了 早期 开创 性 的 并 有 广泛 影响 
的 贡献 。 在 本 节 的 最 后 ,我 们 讨论 他 们 论文 中 三 个 方面 的 问题 :11)“ 啤 酒 
或 热狗 "(Beer & Quiche) 信 和 号 博弈 , 它 说 明了 明显 不 合理 的 精炼 由 叶 斯 均 
衡 也 可 以 满足 信号 要 求 5;{2) 对 信号 要 求 5 的 一 个 强化 要 求 { 但 绝 非 可 能 
的 最 强 条 人 忻 的 要 求 ), 称 为 直观 标准 (3) 直 观 标 淮 在 斯 豆 斯 的 就 业 市 场 信 和 叶 
博弈 中 的 应 用 。 

在 “啤酒 或 热狗 "信号 博弈 中 , 发 送 痢 有 两 种 可 能 的 类 型 :r= 软弱 型 
(wimpy)( 以 0.1 的 概率 }, co = 粗暴 型 (surly) (以 0.9 的 概率 )。 发 送 者 的 
信和 叶 是 早餐 选择 啤酒 还 是 热狗 ;接收 者 的 行动 是 哄 定 是 否 与 发 送 者 挑 起 冲 
突 。 各 方 收益 情况 表现 出 如 下 特征 :软弱 类 型 偏好 选择 热狗 作 早餐 ,粗暴 类 
型 偏好 啤酒 , 两 种 类 型 都 厅 愿 意 同 接收 者 相 冲 突 { 并 与 早餐 吃 什么 相 比 ,更 
关心 这 一 点 ); 接 收 者 则 偏好 与 软弱 类 型 挑 起 冲突 , 但 不 希望 与 粗 棱 类 型 挑 
起 冲突 {可 以 看 出 ,如 果 将 这 一 博 讲 中 类 型 ,信号 和 行动 的 名 称 稍 作 更 换 , 就 
可 以 成 为 进入 壁 鱼 模型 ,与 在 米尔 格 龙 和 罗 伯 获 (1992) 中 的 分 析 相 和 似 )。 在 
图 4.4.3 的 扩展 式 表 述 中 ,享用 自己 所 仿 好 的 早餐 给 两 种 类 型 带 来 的 收益 
都 是 1, 而 避免 冲突 给 两 种 类 型 带 来 的 额外 收益 为 2。 接收 者 通过 与 软弱 类 
型 (粗暴 类 型 ?冲突 获得 的 改 益 分 别 为 1{ -1); 所 有 其 他 情况 的 收益 为 9。 

在 这 一 博弈 中 ,ft 热狗 ,热狗 ), (不 冲突 ,了 串 帘 ), 户 =0.1,9] 对 任意 gS 
1/2 构成 一 个 误 同 精炼 中 叶 斯 均衡 。 而 且 这 一 均衡 满足 信号 要 求 $, 因 为 啤 
酒 对 两 种 类 型 的 发 送 者 者 不 是 省 信和 号。 具体 地 说 , 软弱 类 型 并 不 能 梨 证 选 
择 热 狗 ( 最 低 的 收益 为 1) HEME ARK RA DEY. HAF 
面 ,接收 者 均衡 路 径 之 外 的 推断 的 确 令 人 人 可疑 ;如果 接 收 者 意料 之 外 地 观测 
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到 啤酒 , 则 他 推测 发 送 者 与 粗暴 型 至 少 有 同样 的 可 能 性 是 软弱 型 ( 即 4 万 17 
2), 即 使 (a) 软 弱 型 选择 啤酒 并 不 能 提高 他 选择 热狗 时 的 均衡 收益 ;(b) 粗 芭 
型 可 能 将 其 收益 从 均衡 条 件 的 2 提高 到 3, 只 要 接收 者 持 有 的 推断 9<172。 
给 定 (a) 和 (b), 可 以 期 望 粗 暴 类 型 在 氮 择 啤酒 之 后 作出 如 下 表白 : 
看 到 我 选择 了 啤酒 ,你 应 该 相信 我 属于 粗暴 类 型 :选择 啤酒 无 法 提 

高 软 联 类 型 的 收益 ,理由 如 (a); 并 且 如 果 选 择 踢 酒 将 使 你 确信 我 是 租 

又 类 型 的 , 则 这 样 履 将 提高 我 的 收益 ,理由 好 (b)。 
如 果 这 样 的 表白 被 相信 了 ,就 可 得 到 g =0, 它 与 上 面 的 混同 精炼 贝 叶 斯 均 
ite HAAR R. 

我 们 可 以 把 这 一 论证 推广 到 第 4.2.A 节 定 义 的 信号 博弈 类 型 , 由 此 得 
到 信号 要 求 6。 


定义 ”给 定 信 号 博弈 中 的 一 个 精炼 贝 叶 斯 均 午 , AM 中 的 信号 om, 称 为 
T PRS z 的 均衡 省 信号 (equilibrium-dominated for type #;), 如果 z; 的 均 
Mila, AU" GRT, 大 于 ti; Kem, 时 最 大 的 可 能 收益 ; 
UV Cri) > mas (ts mj ay) 


信号 要 求 6 (“直观 标准 "， 赵 和 克 雷 普 斯 ,1987); 如 果 mi 之 后 的 信 
SRT ORAS, Am, 为 类 型 5 的 均衡 劣 信号 , 则 (在 可 能 的 情况 
下 ) 接 收 者 的 推断 py C2; | oo ) 中 分 配给 类 型 5 的 概率 应 该 等 于 0( 如 果 m; 不 
对 工 中 所 有 的 类 型 都 是 均衡 劣 信号 , 即 属 要 求 中 的 “可 能 情况 ”)。 
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“WG EER ES m IUE, IBIAS, 即使 它 非 
6 的 劣 信 号 。 不 过 , WR mi 为 1; 的 劣 信号 , 则 mj 一 定 为 1; 的 的 衡 劣 信号 ， 
于 是 信号 要 求 6 的 限定 使 得 信号 要 求 5 成 为 多余 。 赵 和 克 雷 普 斯 运用 科 尔 
{045 FRR RT (Kohlberg & Mertens, 1986) 发 展 出 的 更 强 的 结论 ,证 明 所 有 
第 4.2.A 节 定 义 的 信和 号 博弈 类 型 都 存在 满足 信号 要 求 6 的 精炼 贝 叶 斯 均 
衡 。 这 里 的 论证 运用 的 逻辑 方法 有 时 称 为 “前 向 归纳 法 ”(forward induc- 
tion)。 因 为 在 解释 背离 行为 时 一 一 即 在 形成 推断 y(t;|m;) 时 一 一 接收 者 
要 考虑 发 送 者 过 去 的 行为 是 不 是 理性 的 , 而 逆向 归纳 法 则 假定 将 来 的 行为 
应 该 是 理性 的 。 

为 说 明 信 号 要 求 6, 我 们 用 它 来 分 析 第 4.2.B 节 中 就 业 市 场 信号 模型 
存在 嫉妒 的 情况 。 前 面 已 讲 到 ,在 这 一 模型 中 存在 大 量 的 混同 , 分离 以 及 杂 
合 精 炬 贝 叶 斯 均衡 。 但 出 人 意料 的 是 ,这 些 均 衡 中 只 有 一 个 分 离 均衡 可 以 
通过 信号 要 求 6 的 检验 一 在 此 分 离 均衡 中 , 低能 力 的 工人 选 掺 自己 完全 
信息 集 条 件 下 的 教育 水 平 , 高 能 力 工人 选择 的 教育 水 平 较 高 , 并 恰好 使 低能 
力 工人 模仿 高 能 力 工人 不 会 带 来 更 高 的 收益 , 如 图 4.4.4 所 示 。 


Ly 


y(H,e) 


y(L,e) 


e*{L) es g 


图 4.4.4 


在 任意 的 精炼 页 叶 斯 均衡 中 , 如果 工 人 选择 教育 水 平 e, 且 企 业 据 此 推 
断 工 人 是 高 能 力 的 概率 为 jy (和 ie), 则 工人 的 工资 将 等 于 
ofktey 一 me ofDe)+il-AmElehy(ELe)l . 
那么 , 低能 力 工 人 选择 。” (LI) 的 效用 至 少 等 于 y[ 工 ,e*(L)]- clL,e” 
( 工 )] , 它 大 手工 人 选择 任何 e> e, 时 的 效用 ,不 论 企业 在 观测 到 e 之 后 所 
持 有 的 推断 如 何 。 用 信号 要 求 5 的 话 来 说 ,就 是 对 低能 力 类 型 的 工人 ,任何 
大 于 e; 的 教育 水 平 s 都 是 劣 信和 导 。 简 要 地 说 , 信和 号 要 求 Met e>e, 的 
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推断 w(tHle)=1, 它 又 意味 着 高 能 为 工人 选择 >e 4B STEM 
要 求 $, 困 为 在 这 样 一 个 均衡 中 企业 必须 对 e, Me 之 间 的 教育 水 平 推断 jg 
(Hie)<1. OS DREAMS BR 5 限定 了 对 e>e, 由 于 不 是 高 能 
力 类 型 的 劣 信和 导 , 应 该 有 ux(Hle)=1; 但 如 果 存 在 一 个 分 离 均衡 , 其 中 高 能 
力 工 人 选择 的 教育 水 平 >e, We 到 AAMAS FEARS 
号 ,于 是 论证 通过 。) 因 此 , 惟一 满 下 依 号 要 求 5 的 分 离 均 衡 就 是 图 4.4.4 中 
Sar Ie. 

从 上 面 的 论证 中 还 可 以 得 到 另 一 个 结论 :在 满足 信号 要 求 5 的 任何 均 
iP, 高 能 力 工 人 的 效用 一 定 至 少 等 于 y( 日 ,e;) -cl(H, e;), 下 面 我 们 证 明 
这 一 点 意味 着 一 些 混 同 及 杂 合 均衡 不 能 满足 信号 要 求 5。 根 据 工 人 是 高 能 
力 的 概率 {gq) 是 否 足 够 低 , 使 得 工资 函数 w=q-y(H,e)+ (1 gj):ytL， 
z) 处 于 高 能 力 工人 通过 点 [e,, y{ 旦 ,se;)] 的 无 差异 曲线 的 下 方 , 可 以 分 为 两 
种 情况 。 

首先 , 我 们 假设 g 值 很 低 , 如 图 4.4.5 所 示 。 在 这 种 情况 中 , 没有 混同 
均衡 可 以 满足 信号 要 求 5, AERA RBA CAR RAKE 
法 达到 yH, e) 一 c( 日 ,es;)。 类 似 地 ,高 能 为 工人 随机 选择 信号 的 杂 合 均 
衡 也 不 能 满足 信号 要 求 5, 因为 在 这 样 的 均 和 本 中 ,混同 发 生 的 (教育 , 工资) 
点 处 于 工资 函数 w= gy(H,e)+ 《1g)'y(L,e) 的 下 方 。 最 后 ,低能 力 
工人 随机 选择 信号 的 杂 合 均衡 也 不 能 满足 信和 号 要 求 5, 因为 在 这 样 的 均衡 
中 ,混同 发 生 的 (教育 , 工资 }) 点 一 定 处 于 低能 为 工人 通过 点 [e” Lh w 
{ 工 )1 的 无 差异 曲线 之 上 , 如 图 4.2.9 所 示 , 从 而 就 位 于 高 能 力 工 人 通过 点 
Ce y H, e,)] 的 无 差异 曲线 之 下 。 综 上 , 在 图 4.4.5 RHR, E 


hy 


y( He) 


g y(H,e) 
+0 -g@) yiLe) 


yiL, e) 
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一 讲 足 信号 要 求 5 Ha WE 4.4. 所 表示 的 分 离 均 
衡 。 . 
现在 我 们 假设 g 值 较 高 , 如 图 4.4.6 所 示 。 与 上 面 的 情况 相似 , 低能 
力 工 人 随机 选择 信号 的 杂 合 均衡 不 能 满足 信号 要 求 5, 但 这 时 混同 均衡 和 
高 能 力 工 人 随机 选择 信号 的 杂 侣 均 街 却 可 能 满足 信号 要 求 5, 只 要 混同 发 
生 的 (教育 , 工资) 点 位 于 图 中 阴影 区 域 之 和 内。 然而, 这 样 的 均衡 却 无 法 满足 
信号 要 求 6。 


Ty y( He) 


q y(He) 
+(1-—q) y(L,e} 


wL, 2) 


5 


Hi 4.4.6 


BA 4.4.7 所 示 的 混同 于 ex HII, 教育 水 平 选择 e> e 对 低能 力 
类 型 来 讲 是 均衡 劣 信号 , 因为 即使 支付 在 教育 水 平 e 之 下 的 最 高 的 工资 
一 一 具体 地 说 ,为 y( 百 ,e), 得 到 的 (教育 ,工资 ) 点 也 处 于 低能 力 工 人 通过 
HRA ep ws) 的 元 差异 曲线 的 下 方 。 不 过 ,位 于 e’ 到 e 之 间 的 教育 选择 ， 
却 不 是 高 能 力 类 型 的 均衡 竺 信号 ;如果 这 样 一 个 选择 可 使 企业 确信 自己 是 
属于 高 能 力 类 型 的 , 则 企业 所 给 的 工资 为 y(H,e), 它 可 使 高 能 力 工人 的 福 
利 比 前 面 混 同 均衡 下 有 所 提高 。 那 么 ,如 果 e <e<e’, MIF SER 6 就 限 
定 了 企业 的 推断 必须 为 (Hle) =1, 它 又 意味 着 我 们 讨论 的 混同 均衡 不 能 
满足 信号 要 求 5, 因为 在 这 样 一 个 均衡 中 , 企业 对 处 于 e“ 和 和 ee” 之 间 的 教育 水 
平 的 推断 必须 为 Af 互 le)<1。 这 一 论证 同样 适用 于 图 中 阴影 区 域 之 内 的 
所 有 混同 及 杂 合 均衡 。 于 是 ,满足 信和 号 要 求 6 的 惟一 精炼 由 时 斯 均衡 就 是 
图 4.4.4 所 示 的 分 离 均衡 。 
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I 
w mh ye) 
q yH, e}. 
WH,es) +(1-g)y{L.e) 
u, 
yiL, e} 
w*{L) 
e"(L} e e'e” es 
Hi 4.4.7 
4.5 进一步 阅读 


米尔 烙 龙 和 罗 伯 蔬 (1982) 提 供 了 人 迟 呈 博弈 在 产业 组 织 理论 领域 的 经 典 
应用 。 在 公司 财务 理论 方面 , 巴 塔 查 里 亚 (1979) 及 利 兰 (Leiandy 和 派 尔 
(Pyle}(1977) 运 用 信号 模型 分 别 分 析 了 股利 政策 以 及 股份 所 有 权 管 理 。 在 
货币 政策 方面 , 罗莱 夫 (1989) 总 结 了 重复 博弈 、 信 号 以 及 声誉 模型 , 饮 尔 
(1990) 运 用 联 赃 类 型 随时 间 发 生 的 (不 可 观测 的 ) 变 化 解释 通货 册 胀 的 时 间 
路 径 。 关 于 空谈 博 讲 的 应 用 ,会见 书 中 已 介绍 过 的 奥斯汀 和 史密斯 (1990)， 
法 雷 尔 和 吉本 斯 (1991), BEB (1989) BR IH (1989) HH. BL 
(Kennan) 49 BR RH (1992 ) XP 4E PRI RFI Be RAS RAHAT — 
个 综述 , 并 强调 罢工 及 诉讼 所 发 挥 的 作用 。 克 兰 顿 (Cramtony 和 特 拉 西 
Tracy)ift1992) 人 允许 工会 选择 是 再 工 还 是 忍耐 ( 即 在 前 期 的 工资 下 继续 工 
作 ); 他 们 证 明理 论 上 经 常会 发 生 忍 耐 ,并且 这 一 模型 可 对 许多 经 验 中 的 墨 
工 提供 解释 。 关 于 声誉 , 参见 索 册 尔 (1985) 的 论文 “信心 理论 " ,其 中 知情 的 
一 方 在 一 系列 的 空谈 博弈 中 , 绛 可 能 基 不 知情 决策 者 的 “朋友”, 也 可 能 是 其 
“和 融和 人 ”。 最 后 ,参见 正 (Cho) 和 索 贝 尔 (1990) 关 于 在 信号 博弈 中 进行 再 精 
炼 的 进一步 内 容 , 包括 在 斯 彭 斯 模型 存在 多 于 两 种 类 型 时 , 通过 再 精炼 挑选 
有 效率 的 分 离 均衡 。 
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4.6 习题， 


第 4.1 节 

4.1 对 下 面 的 扩展 式 博弈 , 推导 其 标准 式 博弈 , 并且 找 出 所 有 的 纯 战 
Wes A ESS OE A A oT E 

4.2 证 明 在 下 面 的 扩 洗 式 博弈 中 ,不 存在 纯 战 略 精 炼 由 叶 期 均衡。 并 
求 出 其 混合 战略 精炼 贝 叶 斯 均衡 ? 


《习题 4. 1b) 


第 4.2 节 
4.3 a 写 出 下 面 的 信号 博弈 的 一 个 混同 精炼 由 时 斯 均衡 , 其 中 两 种 
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类 型 的 发 送 者 都 选择 信号 Ro 


(JMi. 3a) 


b. 下 面 的 三 类 型 信号 博弈 由 自然 的 行动 开始 ,没有 在 树 上 表示 出 来 ， 
以 同样 的 概率 赋予 发 送 者 三 种 类 型 中 的 一 种 。 写 出 一 个 混 局 精炼 兵 叶 斯 均 
衡 ,其 中 三 种 类 型 的 发 送 者 都 选择 信和 号 工 。 

4.4 ” 写 出 以 下 六 号 博弈 中 所 有 的 纯 战 略 汤 同 及 分 离 精炼 贝 叶 斯 均 
8. 

4.5 求 出 习题 4.3(a} 和 (b}) 中 的 所 有 纯 战略 精炼 风 叶 斯 均衡 。 

”4.6 下 面 的 信号 博弈 珊 于 与 图 4.1.1 相同 类 型 的 完全 非 完美 信息 动 

AiR. (882, Me, 可 以 看 成 图 4.1.1 中 参与 者 1 的 行动 AMOR 
信和 号 博弈 中 的 发 送 者 选择 了 R, 则 事实 上 博弈 已 经 结束 , 与 图 4.1.1 中 参与 
者 1 选择 及 的 情况 类 似 。) 求 出 此 信和 号 博弈 的 (0) 纯 战 略 贝 叶 斯 纳什 均衡; 


2,1 
( SIMA. 3b) 


(i) SC Ae. ASCO SA 4.1.1 中 的 纳什 均衡 
及 精炼 贝 叶 斯 均衡 相 比 较 。 

4.7 画 出 两 类 型 就 业 市 场 信号 模型 中 的 无 差异 曲线 和 生产 函数 , 并 写 
出 它 的 一 个 准 分 离 畏 炼 见 叶 斯 均衡 , 其 中 高 能 力 工人 随机 选择 信号 。 


第 4.3 节 

4.8 解 出 下 面 空谈 博弈 的 纯 战 略 精炼 只 叶 斯 均衡 。 上 自然 晤 子 每 一 种 
类 型 的 概率 相等 。 和 图 4.3.1 相同 ,每 一 单元 格 的 第 一 个 值 表示 发 送 者 收 
益 , 第 二 个 信和 表示 接收 者 收益 , 但 该 图 却 不 表示 一 个 标准 式 捕 弈 ,而 只 是 给 
出 每 一 类 型 行动 组 合 下 参与 者 的 收益 情况 。 


4.9 考虑 第 4.3.A 节 讨 论 的 克 劳 福 德 和 索 贝 尔 空谈 模型 的 例子 :发 
送 者 的 类 型 均 杀 分 布 于 从 0 到 工 的 区 间 ( 正 式 地 , 工 =[0,1]j 且 对 T 中 的 所 
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有 ,p(ti)=1); 行 动 空间 是 从 0 到 1 AEEA = 0,11), ERAN KRR 
数 为 Urg(i,a) = 一 {a 一 t 阁 ;发 送 者 的 收益 函数 为 Us(t,a)=—-La-Cr+ 
5)]2。 对 什么 样 的 五 值 ,存在 三 段 均 衡 ? 在 三 段 均衡 和 二 眉 均 浠 中, Hu 
者 的 期 望 收益 哪个 重 商 ? 哪些 区 型 的 发 送 者 在 三 段 均衡 中 能 够 得 到 更 高 的 
收益 ? 

4.10 ”两 个 合伙 人 必须 就 其 合伙 企业 进行 清算 。 合 伙 人 1 现在 拥有 的 
权益 份额 为 *, 合 优 人 2 拥有 1-s。 两 台 伙 人 同意 进行 如 下 搏弈 : 合 忧 人 1 
提出 一 个 价格 ,然后 合伙 大 2 可 以 选择 以 ps 的 价格 购买 合 炙 大 工 的 最 
H.R pad- 53) 的 价格 将 自己 的 股份 卖 给 合 居 人 1. REEMA KAM 
HASH ELAM eee, 且 服 从 [0, 1 区 间 的 均 负 分 布 , 以 上 是 
共同 知识 。 但 每 一 台 伙 人 的 估价 是 私人 信息 。 求 出 博弈 的 精炼 贝 叶 斯 均 
fi. 

4.11 买方 和 卖方 对 商品 的 估价 分 别 汶 vw Myo, BRB eH 
(Bl ww > mm,) 是 共同 知识 ,但 收益 的 天 小 却 是 私人 信息 ,具体 情况 如 二 : 卖 
方 的 估价 服从 [0,1] 区 则 的 均匀 人 分布; 买方 的 估价 wm = kv, RB ROL 
共 间 知识 ;卖方 了 解 w (从 而 知道 ww), 但 买方 却 不 清楚 ov, (BR v) BREE 
方 给 出 一 个 单一 买 价 p, 卖方 虐 可 以 接受 , 又 可 以 拒绝 。 当 <2 时 .博弈 精 
炼 由 叶 斯 均 瞻 是 什么 ”上 & 交 2 时 呢 ? {参见 萨 纪 尔 森 (1984)) 

4.12 ”本题 考 虑 第 4.3.B 节 分 析 的 两 阶段 谈判 博弈 元 限期 进行 下 去 
的 情况 。 和 前 面 的 假定 相同 , 企业 对 自己 的 利润 (x) 拥 有 私人 信息 ,服从 
[0, ro 区 闻 的 均匀 分 布 ,所 有 阶段 都 由 工会 提出 工资 要 价 , AAT RET 
资 水 平 w, =0。 

在 两 阶段 博弈 中 , 如 果 >n, HERS TSH RRB wh RH 
的 利润 类 型 n 使 下 面 酚 种 情况 无 差异 (i) 接 爱 wi;(ii) 拒 绝 wp 并 接受 工 
会 第 二 期 的 要 价 wz, 这 里 ws 是 企业 利润 服从 [0, wi] 上 的 均 名 分 布 且 谈 漳 
到 了 最 后 一 期 时 工会 的 最 优 要 价 。 在 无 限期 的 情况 下 , 与 此 不 同 的 是 ,oa 
是 企业 利润 服从 {0, mm ] 上 的 均匀 分 布 , 且 在 谈判 还 要 ( 光 在 地 ) 继 续 无 限期 
地 进行 下 去 的 条 件 下 ,工会 的 最 优 要 价 。 尽 管 m HERRERA) CE 
SAAN, w, 的 变化 将 导致 x 也 发 生变 化 。 

冶 于 无 限期 博弈 第 二 期 的 后 续 博 弈 在 性 质 上 相当 于 整个 博弈 :依然 存 
在 潜在 的 无 限期 谈判 ,并且 企 业 的 利润 仍 昭 从 06 到 一 个 上 限 疗 的 均匀 分 
布 ; 推 一 的 区 别 就 是 这 里 的 上 限 不 再 是 w, MEA mi。 索 贝尔 和 高 桥 
(1983) 证 明 , 无 限期 搏弈 存在 一 个 静态 的 精炼 页 叶 斯 均 衔 。 在 这 一 均衡 中 ， 
如 果 企 业 的 利润 服从 0 到 ”之 间 的 均匀 分 布 , 则 工会 开 出 的 工资 要 价 为 
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wr" = be", FRB EGAN bx, 第 二 期 为 tm, 如 此 等 等 。 如 果 工 
会 选择 上 面 的 静态 戌 略 , 企业 的 最 优 反 应 可 以 求 得 为 x = emg, wz = eng, 如 
此 等 等 ,并且 当 企业 利润 服从 0 到 六 区 间 的 均匀 分 布 时 , 工会 期 望 收 益 的 
现 值 为 vtxr*)y=dx*。 证 明 避 =2d,c=17[1+ Jt-s8JB d@=[/1-é- 
(1-8)]/26. 

4.13 企业 和 工会 进行 下 面 的 两 阶段 谈判 博弈 。 企 业 利润 r 服 从 0 到 
1 之 间 的 均匀 分 布 ,工会 的 保留 工资 为 w 以 上 都 是 共同 知识 , 只 有 企业 才 
TH rR. Be O< we. <172, 求 出 下 面 博弈 的 精炼 中叶 斯 均衡 : 

1. 在 第 一 阶段 的 开始 ,工会 向 企业 提出 一 个 工资 要 价 ws; 

2. 企业 或 接受 或 拒绝 w 如 果 企 业 接 受 w, 则 两 险 段 都 可 以 开工 生 

产 ,于 是 工会 的 收益 为 2w, 企业 收益 为 2Lx 一 zw1) CSR 
素 )。 如 果 企 业 拒 绝 w, 则 第 一 期 就 没有 产 出 , 且 企 业 和 工会 第 一 
阶段 的 收益 都 等 于 0; 

3. 在 第 二 阶段 的 开始 ( 稻 定 企业 拒绝 了 w), 企业 向 工会 提出 一 个 工 
资 出 价 wx 不 同 于 索 贝 尔 和 高 桥 的 模型 , 这 一 出 价 不 再 由 工会 提 
H}; 

4. 工会 或 接受 或 拒绝 这 一 出 价 , 如 果 工 会 接受 w 则 第 二 期 会 有 产 
出 ,于 是 第 二 期 (也 是 全 部 ) 的 收益 为 工会 w, 企业 x 一 w2( 前 面 已 
讲 过 第 一 期 的 收益 为 07。 如 果 工 会 拒绝 w:, 则 没有 产 出 ,工会 在 第 
二 期 赚 得 其 保留 工资 w, 企业 关闭 ,收益 为 0。 

4.14 纳 莱 巴 夫 (Nalebuff, 1987) 分 析 了 下 面 的 原告 和 被 告 之 间 在 开庭 
审判 前 谈判 的 模型 。 如 果 案 件 交 到 法 庭 ,被 告 被 迫 支付 给 原告 损害 赔偿 a, 
娘 服 从 从 [0,1] 区 间 的 均匀 分 布 , 只 有 被 告 才 知道 4 的 真正 值 ,以 上 是 共同 
知识 。 交 到 法 庭 则 使 原告 花费 < 和 1/2, 但 (为 简单 起 见 ) 不 增加 被 告 的 成 
本 。 

请 亦 时 间 顺 序 如 下 :(1) 原 告 提出 一 个 解决 方案 要 约 if2) 被 告 选 择 接 
受 和 解 (这 时 原告 的 收益 为 s, 被 告 的 收益 为 -s) 或 者 拒绝 ;(3) 如 果 被 上告 拒 
绝 *, 则 产 告 抉 定 到 法 庭 起 诉 , 这 时 产 告 的 收益 为 d - c, 被 告 的 收益 为 - a, 
或 是 放弃 起 诉 , 这 种 情况 下 双方 参与 者 的 收益 都 为 0。 

在 第 (3} 阶 段 , 如 果 原 告 相信 存在 一 些 a 的 值 , 当 且 仅 当 了 >d 时 被 
告 将 选择 和 解 ,原告 关于 是 否 起 诉 的 最 优 决 策 是 什么 ? 在 第 (2) 阶 段 , 对 给 
定 的 要 约 s, 如果 被 告 推断 拒绝 后 原告 将 向 法 庭 起 诉 的 概率 为 p, 被 告 的 类 
型 为 了 时 ,其 最 优 的 和 解决 策 是 什么 ? 如 果 要 约 ; >2c, 开始 于 阶段 (2) 的 
连续 博弈 的 精炼 中叶 斯 均衡 是 什么 ? 如 果 要 约 s 达 2c WE? 如 果 c<173, 求 
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EEA A T a ee, BR 1/3 达 < 万 1/2 呢 ? 

4.15 考虑 一 个 立法 过 程 .其 中 可 行 的 政策 从 p=0 到 p=1 之 间 连 续 
波动 。 赋 会 理想 中 的 政策 为 c, 但 政策 现状 为 ;, 这 里 0<c<s<1, 也 就 是 
说 , 国会 理想 中 的 政策 位 于 现行 政策 的 左 侧 。 总 统 认 为 的 理想 政策 为 , 腿 
从 [0,1] 区 间 上 的 均匀 分 布 ,但 属 总 统 本 人 的 私人 信息 。 时 间 顺 序 非 常 简 
单 :国会 提议 一 个 政策 p, 总 统 可 以 选择 签署 还 是 否 尖 。 如 果 p 被 签署 通 
过 , 则 国会 的 收益 为 一 (c 一 pp 总 统 的 收益 为 一 Cz 一 这; 如果 p MR, 
则 收益 分 别 为 一 (ec 一 :站 和 一 (一 ss 六。 什么 是 精炼 贝 叶 斯 均衡 ? 证 明 在 
HEP c< p<s. 

现在 ,假设 在 国会 提出 政策 议案 之 前 .总统 可 以 发 表 一 篇 演说 {( 即 可 发 
送 一 个 空谈 信号 ]。 考 虑 一 个 两 防 段 精炼 贝 叶 斯 均衡 , 其 中 国会 根据 总 统 发 
送 上 蔚 一 种 信和 号 ,而 选择 议案 pi 或 pr。 证 明 在 这 样 的 均衡 中 不 可 能 有 e< 
PLE pp<s。 并 解释 为 什么 由 此 可 以 推出 均衡 中 , 国会 的 议案 不 可 能 有 三 
个 或 更 和 多? 推导 在 c= p< puls 条件 下 的 两 有 段 均 衡 前 详细 结果 . wR 
型 选择 哪 种 信号, A py 的 值 是 什么 ? 【参见 马 修 斯 , 1989) 


第 4.4 节 

4.16 考虑 习题 4.3(ay 和 (b) 描 述 的 混同 均衡 。 对 每 一 个 均衡 :检验 
支持 该 均衡 的 推断 是 否 满 足 信 号 要 求 5; 检 验 支 持 均衡 的 推断 是 否 满 足 信 
号 要 求 6 直观 标准 )。 
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